Incremental active learning of sensorimotor models in developmental robotics

Ribes Sanz, Arturo

Incremental active learning of sensorimotor models in developmental robotics

Ribes Sanz, Arturo

Supervised by:

Ramón López de Mántaras Director
Ricardo Juan Toledo Morales Director
Jesús Cerquides Bueno Director
Yiannis Demiris Director

Defence university: Universitat Autònoma de Barcelona

Fecha de defensa: 23 March 2015

Committee:

Carles Sierra Chair
Arnau Ramisa Ayats Secretary
Dídac Busquets Font Committee member

Type: Thesis

Teseo: 383284 DIALNET TDX editor

Abstract

La rápida evolución de la robótica esta promoviendo que emerjan nuevos campos relacionados con la robótica. Inspirándose en ideas provinientes de la psicología del desarrollo, la robótica del desarrollo es un nuevo campo que pretende proveer a los robots de capacidades que les permiten aprender de una manera abierta durante toda su vida. Hay situaciones donde los ingenieros o los diseñadores no pueden prever todos los posibles problemas que un robot pueda encontrar. Tal como el número de tareas que un robot debe hacer crece, este problema se vuelve más evidente, y las soluciones de ingenería tradicionales pueden no ser completamente factibles. En tal caso, la robótica del desarrollo proporciona una serie de principios y directrices para construir robots que tienen las herramientas cognitivas adecuadas a fin de adquirir el conocimiento necesario. Auto-exploración, aprendizaje incremental, scaffolding social e imitación. Todas son herramientas que contribuyen a construir robots con un alto grado de autonomía. Mediante la auto-exploración internamente motivada, un robot descubre lo que su cuerpo es capaz de hacer. Las técnicas de aprendizaje incremental permite que un robot tenga conocimiento listo al instante, a partir de construir estructuras cognitivas encima de otras más viejas. El scaffolding o andamiaje social y las capacidades de imitación permiten aprovechar lo que los humanos --- u otros robots --- ya saben. De esta manera, los robots tienen metas que perseguir y aportan, o bien un uso final para las habilidades aprendidas, o bien ejemplos de cómo lograr una determinada tarea. Esta tesis presenta un estudio de una serie de técnicas, las cuales ejemplifican cómo algunos de esos principios, aplicados a robots reales, funcionan juntos, permitiendo al robot aprender autónomamente a ejecutar una serie de tareas. También mostramos cómo el robot, aprovechándose de técnicas de aprendizaje activo e incremental, es capaz de decidir la mejor manera de explorar su entorno a fin de adquirir el conocimiento que mejor le ayuda a lograr sus objetivos. Ésto, añadido al descubrimiento autónomo de las limitaciones de su propio cuerpo, disminuye la cantidad de conocimiento especifico del dominio que es necesario poner en el diseño del sistema de aprendizaje. Primeramente, presentamos un algoritmo de aprendizaje incremental para Modelos de Mixtura de Gaussianas aplicado al problema de aprendizaje sensorimotor. Implementado en un robot móvil, el objetivo es adquirir un modelo que es capaz de realizar predicciones sobre los estados sensoriales futuros. Este modelo predictivo es reutilizado como substrato representacional, el cual sirve para categorizar y anticipar situaciones tales como la colisión contra un objeto. Después de un periodo extendido de aprendizaje, y habiendo encontrado situaciones diferentes, observamos que los modelos adquiridos se terminan siendo bastante grandes. Sin embargo, nos dimos cuenta que, en un momento dado, solo una pequeña porcion del mismo es utilizada. Además, estas areas son utilizadas consistentemente por un periodo relativamente largo de tiempo. Presentamos una extensión para el algoritmo de Regresión basado en Mixturas de Gaussianas, el cual aprovecha este hecho a fin de reducir el coste computacional de la inferencia. Las técnicas aquí presentadas fueron también aplicadas en un problema diferente y más commplejo: la imitación de una secuencia de notas musicales proporcionadas por un humano. Estas son producidas por un objeto musical virtual que es utilizado por un robot humanoide. El robot no solo aprende a utilizar este objeto, sino que también aprende sobre las limitaciones de su propio cuerpo. Ésto le permite entender mejor qué puede hacer y cómo puede hacerlo, subrayando la importancia de la influencia que el hecho de tener cuerpo tiene en la interacción del robot con su entorno y el tipo de estructuras cognitivas que se forman como consecuencia de este tipo de interacción.