Marco de descubrimiento de conocimiento para datos estructuralmente complejos con énfasis en el análisis de eventos en series temporales

  1. Torralbo Lara, Alfonso
Dirigée par:
  1. Aurora Pérez Pérez Directeur/trice
  2. Juan Pedro Caraça-Valente Hernández Directeur/trice

Université de défendre: Universidad Politécnica de Madrid

Fecha de defensa: 21 février 2011

Jury:
  1. Fernando Alonso Amo President
  2. Loïc Antonio Martínez Normand Secrétaire
  3. Daniel Borrajo Millán Rapporteur
  4. Alicia Troncoso Lara Rapporteur
  5. Africa López Illescas Rapporteur

Type: Thèses

Teseo: 302791 DIALNET

Résumé

El proceso de Descubrimiento de Conocimiento en Bases de Datos (más conocido por su nombre en inglés, Knowledge Discovery in Databases) es el proceso de extracción de conocimiento útil, implícito y previamente desconocido a partir de grandes volúmenes de datos. Dicho proceso se compone de diferentes etapas entre las que cabe destacar la etapa de Data Mining, en la que se analizan los datos y se extrae conocimiento útil de ellos haciendo uso de un conjunto de algoritmos. Data Mining ofrece una gran variedad de técnicas para resolver diferentes tipos de problemas. En los últimos años, dichas técnicas han sido empleadas en multitud de dominios en los que el análisis se ha centrado en individuos cuya información se representa habitualmente mediante una tabla de atributos univaluados de tipo entero, real o enumerado. Sin embargo, existen muchos dominios en los que cada individuo no se representa mediante una simple tabla de atributos sino mediante un conjunto de datos con estructura más compleja, incluyendo tanto atributos univaluados como series temporales. El análisis de esos datos requiere nuevos enfoques. En esta Tesis se ha propuesto un marco de trabajo para el descubrimiento de conocimiento útil a partir de datos estructuralmente complejos, que pueden contener tanto series temporales como datos univaluados. Dicho marco consta de herramientas para la modelización conceptual, comparación y obtención de modelos de referencia a partir de esos datos. En particular, se han propuesto algoritmos para el análisis de series temporales en las que la información relevante de las mismas se concentra solo en aquellas regiones que se corresponden con eventos de interés para los expertos de cada dominio. El marco de extracción de conocimiento propuesto ha sido probado sobre datos estructuralmente complejos procedentes de dos áreas médicas: la Estabilometría, una disciplina que estudia el equilibrio de los seres humanos, y la Neurología, un área médica que estudia las enfermedades del sistema nervioso y los músculos. La obtención de resultados satisfactorios en dominios tan complejos y diferentes entre sí confirma la generalidad del marco propuesto.