Observatorio de I+D+i UPM

Memorias de investigación
Ponencias en congresos:
A Unified Framework for Linear Function Approximation of Value Functions in Stochastic Control
Año:2013
Áreas de investigación
  • Tecnología electrónica y de las comunicaciones
Datos
Descripción
This paper contributes with a unified formulation that merges previ- ous analysis on the prediction of the performance ( value function ) of certain sequence of actions ( policy ) when an agent operates a Markov decision process with large state-space. When the states are represented by features and the value function is linearly approxi- mated, our analysis reveals a new relationship between two common cost functions used to obtain the optimal approximation. In addition, this analysis allows us to propose an efficient adaptive algorithm that provides an unbiased linear estimate. The performance of the pro- posed algorithm is illustrated by simulation, showing competitive results when compared with the state-of-the-art solutions
Internacional
Si
Nombre congreso
EUSIPCO, Signal Processing Conference
Tipo de participación
960
Lugar del congreso
Morocco
Revisores
Si
ISBN o ISSN
2219-5491
DOI
Fecha inicio congreso
09/09/2013
Fecha fin congreso
13/09/2013
Desde la página
1
Hasta la página
5
Título de las actas
Proceedings of EUSIPCO
Esta actividad pertenece a memorias de investigación
Participantes
  • Autor: Santiago Zazo Bello (UPM)
Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Grupo de Aplicaciones del Procesado de Señal (GAPS)
  • Departamento: Señales, Sistemas y Radiocomunicaciones
S2i 2021 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)