Cavazos Cadena, Rolando.

Recursive adaptive control of average Markov Decision Proce-sses / by Rolando Cavazos Cadena and Onésimo Hernández Lerm-a. - México, D.F. : tamento de Matemáticas - 19 p. - Reporte interno; no. 28 / Instituto Politécnico Nacional, C-INVESTAV, Departamento de Matemáticas .