Aprendizaje de comportamientos de navegación en planificadores RRT*
- 1 Univesidad Pablo de Olavide
-
2
Universidad de Sevilla
info
Editorial: Servizo de Publicacións ; Universidade da Coruña ; Comité Español de Automática
ISBN: 978-84-9749-808-1
Año de publicación: 2016
Páginas: 724-731
Congreso: Jornadas de Automática (37. 2016. Madrid)
Tipo: Aportación congreso
Resumen
Este trabajo presenta un algoritmo para el aprendizaje de comportamientos de navegación a partir de demostraciones usando árboles de exploración aleatoria óptimos (RRT*) como planificador de caminos. El algoritmo de aprendizaje combina las técnicas de Inverse Reinforcement Learning (IRL) y RRT* para aprender los pesos de la función de coste a partir de trayectorias de demostración. Esta función de coste puede ser usada más tarde en el algoritmo RRT* permitiendo al robot reproducir el comportamiento deseado en distintos escenarios. El método ha sido probado primero en simulación y luego usando trayectorias reales de un robot en el laboratorio.