Statistical learning in complex and temporal datadistances, two-sample testing, clustering, classification and Big Data

  1. Montero Manso, Pablo
unter der Leitung von:
  1. José Vilar Doktorvater/Doktormutter

Universität der Verteidigung: Universidade da Coruña

Fecha de defensa: 30 von Januar von 2019

Gericht:
  1. Alicia Troncoso Lara Präsidentin
  2. Rubén Fernández Casal Sekretär/in
  3. Jorge Caiado Vocal

Art: Dissertation

Teseo: 580496 DIALNET lock_openRUC editor

Zusammenfassung

Esta tesis trata sobre aprendizaxe estatístico en obxetos complexos, con énfase en series temporais. O problema abórdase introducindo coñecemento sobre o dominio do fenómeno subxacente, mediante distancias e características. Proponse un contraste de dúas mostras basado en distancias e estúdase o seu funcionamento nun gran abanico de escenarios. As distancias para clasificación e clustering de series temporais acadan un incremento da potencia estatística cando se aplican a contrastes de dúas mostras. O noso test compárase de xeito favorable con outros métodos gracias á súa flexibilidade ante diferentes alternativas. Defínese unha nova distancia entre series temporais mediante un xeito innovador de comparar as distribucións retardadas das series. Esta distancia herda o bo funcionamento empírico doutros métodos pero elimina algunhas das súas limitacións. Proponse un método de predicción baseada en características das series. O método combina diferentes algoritmos estándar de predicción mediante unha suma ponderada. Os pesos desta suma veñen dun modelo que se axusta a un conxunto de entrenamento de gran tamaño. Propónse un método de clasificación distribuida, baseado en comparar, mediante unha distancia, as funcións de distribución empíricas do conxuto de proba común e as dos datos que recibe cada nodo de cómputo.