Marco de descubrimiento de conocimiento para datos estructuralmente complejos con énfasis en el análisis de eventos en series temporales

  1. Torralbo Lara, Alfonso
Dirigida por:
  1. Aurora Pérez Pérez Director/a
  2. Juan Pedro Caraça-Valente Hernández Director/a

Universidad de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 21 de febrero de 2011

Tribunal:
  1. Fernando Alonso Amo Presidente/a
  2. Loïc Antonio Martínez Normand Secretario/a
  3. Daniel Borrajo Millán Vocal
  4. Alicia Troncoso Lara Vocal
  5. Africa López Illescas Vocal

Tipo: Tesis

Teseo: 302791 DIALNET

Resumen

El proceso de Descubrimiento de Conocimiento en Bases de Datos (más conocido por su nombre en inglés, Knowledge Discovery in Databases) es el proceso de extracción de conocimiento útil, implícito y previamente desconocido a partir de grandes volúmenes de datos. Dicho proceso se compone de diferentes etapas entre las que cabe destacar la etapa de Data Mining, en la que se analizan los datos y se extrae conocimiento útil de ellos haciendo uso de un conjunto de algoritmos. Data Mining ofrece una gran variedad de técnicas para resolver diferentes tipos de problemas. En los últimos años, dichas técnicas han sido empleadas en multitud de dominios en los que el análisis se ha centrado en individuos cuya información se representa habitualmente mediante una tabla de atributos univaluados de tipo entero, real o enumerado. Sin embargo, existen muchos dominios en los que cada individuo no se representa mediante una simple tabla de atributos sino mediante un conjunto de datos con estructura más compleja, incluyendo tanto atributos univaluados como series temporales. El análisis de esos datos requiere nuevos enfoques. En esta Tesis se ha propuesto un marco de trabajo para el descubrimiento de conocimiento útil a partir de datos estructuralmente complejos, que pueden contener tanto series temporales como datos univaluados. Dicho marco consta de herramientas para la modelización conceptual, comparación y obtención de modelos de referencia a partir de esos datos. En particular, se han propuesto algoritmos para el análisis de series temporales en las que la información relevante de las mismas se concentra solo en aquellas regiones que se corresponden con eventos de interés para los expertos de cada dominio. El marco de extracción de conocimiento propuesto ha sido probado sobre datos estructuralmente complejos procedentes de dos áreas médicas: la Estabilometría, una disciplina que estudia el equilibrio de los seres humanos, y la Neurología, un área médica que estudia las enfermedades del sistema nervioso y los músculos. La obtención de resultados satisfactorios en dominios tan complejos y diferentes entre sí confirma la generalidad del marco propuesto.