Observatorio de I+D+i UPM

Memorias de investigación
Ponencias en congresos:
Deep Reinforcement Learning for Autonomous Model-Free Navigation with Partial Observability
Año:2019
Áreas de investigación
  • Control adaptativo
Datos
Descripción
Navigation is known to be a hard Sequential Decision-Making problem that attracts the attention of a large number of fields like Artificial Intelligence or Robotics. In this work, we approach the problem of partially observable navigation with a reactive system trained by model-free Reinforcement Learning. The advantages of this learned approach include reducing the engineering effort at the cost of more computing power during training. We designed an agent and an environment with a focus on being able to navigate independently of the map. We use well-tested general Reinforcement Learning algorithms without any hyper-parameter tuning and achieve promising results. Our results show that several general purpose Reinforcement Learning algorithms can reach the target in our navigation setup more than 85% of the episodes. Hence, these algorithms may provide a significant step forward towards autonomous navigation systems.
Internacional
Si
Nombre congreso
2019 27th European Signal Processing Conference (EUSIPCO)
Tipo de participación
960
Lugar del congreso
A Coruña
Revisores
Si
ISBN o ISSN
978-9-0827-9703-9
DOI
10.23919/EUSIPCO.2019.8902933
Fecha inicio congreso
02/09/2019
Fecha fin congreso
06/09/2019
Desde la página
1
Hasta la página
5
Título de las actas
2019 27th European Signal Processing Conference (EUSIPCO)
Esta actividad pertenece a memorias de investigación
Participantes
  • Autor: Daniel Tapia (Universidad Politécnica de Madrid)
  • Autor: Juan Parras Moral (UPM)
  • Autor: Santiago Zazo Bello (UPM)
Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Centro o Instituto I+D+i: Centro de I+d+i en Procesado de la Información y Telecomunicaciones
  • Grupo de Investigación: Grupo de Aplicaciones del Procesado de Señal (GAPS)
  • Departamento: Señales, Sistemas y Radiocomunicaciones
S2i 2021 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)