Statistical learning in complex and temporal datadistances, two-sample testing, clustering, classification and Big Data

  1. Montero Manso, Pablo
Dirigida por:
  1. José Vilar Director/a

Universidad de defensa: Universidade da Coruña

Fecha de defensa: 30 de enero de 2019

Tribunal:
  1. Alicia Troncoso Lara Presidenta
  2. Rubén Fernández Casal Secretario/a
  3. Jorge Caiado Vocal

Tipo: Tesis

Teseo: 580496 DIALNET lock_openRUC editor

Resumen

Esta tesis trata sobre aprendizaje estadístico en objetos complejos, con énfasis en series temporales. El problema se aborda introduciendo conocimiento del dominio del fenómeno subyacente, mediante distancias y características. Se propone un test de dos muestras basado en distancias y se estudia su funcionamiento en un gran abanico de escenarios. La distancias para clasificación y clustering de series temporales consiguen un incremento de la potencia estadística cuando se aplican al tests de dos muestras. Nuestro test se compara favorablemente con otros métodos gracias a su flexibilidad antes diferentes alternativas. Se define una nueva distancia entre series temporales mediante una manera innovadora de comparar las distribuciones retardadas de la series. Esta distancia hereda el buen funcionamiento empírico de otros métodos pero elimina algunas de sus limitaciones. Se propone un método de predicción basado en características de las series. El método combina diferentes algoritmos estándar de predicción mediante una suma ponderada. Los pesos de esta suma salen de un modelo que se ajusta a un conjunto de entrenamiento de gran tamaño. Se propone un método de clasificación distribuida, basado en comparar, mediante una distancia, las funciones de distribución empírica del conjuto de prueba común y las de los datos que recibe cada nodo de cómputo.