Preprocessing and ensemble approaches for singular problemsmonotonic and imbalanced classification

  1. González Vázquez, Sergio
Supervised by:
  1. Francisco Herrera Triguero Director
  2. Salvador García López Director

Defence university: Universidad de Granada

Fecha de defensa: 30 July 2020

Committee:
  1. José Cristobal Riquelme Santos Chair
  2. Julián Luengo Martín Secretary
  3. Luciano Sánchez Ramos Committee member
  4. Siham Tabik Committee member
  5. Isaac Triguero Velázquez Committee member

Type: Thesis

Abstract

Esta tesis se centra en dos problemas supervisados singulares: clasificación desbalanceada y la clasificación con restricciones monotónicas. Esta tesis pretende proponer nuevas soluciones basadas en clasificadores robustos y técnicas de preprocesamiento para estos dos singulares problemas supervisados. En esencia, el objetivo principal de esta tesis es diseñar nuevas soluciones para dichos problemas, tanto de manera independiente como conjunta, y considerando otras situaciones singulares de datos, tales como la presencia de ruido. Como se ha mencionado anteriormente, estas propuestas siguen dos aproximaciones diferentes similares a los enfoques tradicionales para problemas singulares: clasificadores robustos y técnicas basadas en el preprocesamiento. Estas aproximaciones abordan cuestiones específicas de clasificación desequilibrada y la clasificación monotónica: Diseño de clasificadores robustos para los problemas singulares de clasificación desbalanceada y monotónica. Dicho objetivo incluye: -Altos niveles de precisión así como de monotonicidad con un clasificador Random Forest para la clasificación monotónica. -Robusto aprendizaje de ensembles basado en Switching según la distancia del enemigo más cercano (SwitchingNED) para problemas altamente desequilibrados. -Gran robustez al ruido monotónico para la clasificación monótona con una propuesta de Fuzzy kNN consciente de las restriciones y violaciones de monotonía. Desarrollo de técnicas basadas en preprocesamiento en clasificación desbalanceada y monotónica. Dentro de este paradigma, se incluyen las siguientes metas: -Mejorar el rendimiento de SwitchingNED mediante su combinación con diferentes téecnicas de muestreo para la clasificación altamente desequilibrada. -Mitigar el impacto de las distribuciones desequilibradas de clases en los problemas de restricciones monótonas gracias a nuevas técnicas de muestreo para la clasificación monótona desequilibrada.