Mejoras en eficiencia y eficacia de algoritmos evolutivos para aprendizaje supervisado

  1. Raúl Giráldez
Zuzendaria:
  1. Jesús Salvador Aguilar-Ruiz Zuzendaria
  2. José Cristobal Riquelme Santos Zuzendaria

Defentsa unibertsitatea: Universidad de Sevilla

Fecha de defensa: 2004(e)ko uztaila-(a)k 09

Mota: Tesia

Laburpena

Los algoritmos evolutivos conforman una de las más importantes familias de modelos computacionales con aplicación en el campo del aprendizaje automático, cuya validez y efectividad han sido ampliamente estudiada en la bibliografía. Enmarcada dentro del área del aprendizaje supervisado, esta tesis doctoral tiene como objetivo fundamental el desarrollo de diversos métodos algorítmicos dirigidos hacia la mejora de este tipo de técnicas para la generación de reglas de decisión. Se pretende reducir el coste computacional asociado a los aspectos críticos de los algoritmos evolutivos, así como aumentar la calidad de los resultados mediante una búsqueda más eficiente y eficaz de las soluciones. En este contexto, adquiere especial relevancia la codificación de los individuos de la población genética. La denominada Codificación Natural se presenta como una de las aportaciones principales de esta investigación, siendo la reducción del espacio de búsqueda, la disminución del tamaño de los individuos y la definición de los operadores genéticos, sus principales mejoras frente a otras codificaciones. Por otra parte, la evaluación de los individuos es un proceso esencial pero altamente costoso. En este sentido, proponemos la estructura de datos EES, que organiza e indexa el conjunto de datos evitando el recorrido completo del mismo, al tiempo que aprovecha la semántica de la reglas de decisión para llevar a cabo una evaluación más inteligente. La herramienta HIDER recoge estas mejoras y constituye la parte fundamental de nuestra investigación. HIDER genera reglas de decisión jerárquicas como modelo de comportamiento de un conjunto de datos etiquetados a la vez que clasifican nuevas instancias de los mismos, dando así soporte en la toma de decisiones. Durante el desarrollo de HIDER, fueron surgiendo propuestas paralelas relacionadas con aspectos concretos de la herramienta. Destaca el algoritmo de discretización supervisada USD, el cual reduce sustancialmente la cardinalidad del conjunto de valores de los atributos continuos. La minimización del error introducido al transformar un dominio continuo y teóricamente infinito en discreto y finito, hace que USD tenga mejor comportamiento que otros métodos desde el punto de vista de la posterior aplicación de algoritmos evolutivos de generación de reglas. Los resultados de las diversas pruebas empíricas realizadas reflejan la calidad y robustez de HIDER, alcanzando importantes mejoras frente a otras herramientas muy contrastadas en la comunidad científica. Asimismo, el estudio llevado a cabo en colaboración con la multinacional ATLANTIC COPPER S.A. como aplicación práctica de HIDER a un proceso industrial, muestra el importante potencial de esta investigación frente a problemas reales.