Aprendizaje de comportamientos de navegación en planificadores RRT*

  1. Noé Pérez-Higueras 1
  2. Luis Merino 1
  3. Fernando Caballero 2
  1. 1 Univesidad Pablo de Olavide
  2. 2 Universidad de Sevilla
    info

    Universidad de Sevilla

    Sevilla, España

    ROR https://ror.org/03yxnpp24

Libro:
Actas de las XXXVII Jornadas de Automática: Madrid. 7, 8 y 9 de septiembre de 2016

Editorial: Servizo de Publicacións ; Universidade da Coruña ; Comité Español de Automática

ISBN: 978-84-9749-808-1

Ano de publicación: 2016

Páxinas: 724-731

Congreso: Jornadas de Automática (37. 2016. Madrid)

Tipo: Achega congreso

Resumo

Este trabajo presenta un algoritmo para el aprendizaje de comportamientos de navegación a partir de demostraciones usando árboles de exploración aleatoria óptimos (RRT*) como planificador de caminos. El algoritmo de aprendizaje combina las técnicas de Inverse Reinforcement Learning (IRL) y RRT* para aprender los pesos de la función de coste a partir de trayectorias de demostración. Esta función de coste puede ser usada más tarde en el algoritmo RRT* permitiendo al robot reproducir el comportamiento deseado en distintos escenarios. El método ha sido probado primero en simulación y luego usando trayectorias reales de un robot en el laboratorio.