Minería de datos aplicada a la microscopía de sistemasestudio de la relación entre las anotaciones fenotípicas y funcionales en células humanas

  1. Serrano Solano, Beatriz
Dirigida por:
  1. Juan Antonio García Ranea Director/a

Universidad de defensa: Universidad de Málaga

Fecha de defensa: 03 de noviembre de 2017

Tribunal:
  1. Guillermo Thode Mayoral Presidente/a
  2. Juan Francisco Morilla Domínguez Secretario/a
  3. Antonio J. Pérez-Pulido Vocal

Tipo: Tesis

Teseo: 513558 DIALNET lock_openRIUMA editor

Resumen

En el ámbito de la Biología Molecular, uno de los métodos tradicionales que se aplica para asignar funciones a los genes se basa en el silenciamiento de los mismos para observar su fenotipo y de ahí, inferir su función. Un principio generalmente aceptado es que la inhibición de genes implicados en un mismo proceso biológico muestra fenotipos parecidos. Sin embargo, dado que evaluar cómo de parecidos son dos fenotipos no siempre resulta trivial, es fundamental contar con la organización de los fenotipos en una ontología como CMPO (Cellular Microscopy Phenotype Ontology). Gracias a la Microscopía de Sistemas, se ha empezado a describir sistemáticamente el espacio fenotípico, caracterizando al gen mediante un perfil fenotípico. Aunque esta descripción multiparamétrica puede parecer en principio más completa por recoger distintas mediciones, la asociación con la función biológica resulta menos evidente y la anotación funcional termina haciéndose manualmente. Para poder efectuar la conversión de un perfil fenotípico en anotación funcional automáticamente, es necesario entender cómo están relacionados los fenotipos y las funciones. Con este objetivo, la primera cuestión es seleccionar una medida de similitud fenotípica entre pares de genes que refleje la similitud funcional. Tras analizar distintas alternativas, se encontró que aquellas basadas en el contenido informativo presentan una mayor correlación con las interacciones funcionales, destacando especialmente la similitud semántica de Resnik sobre la ontología CMPO. Sin embargo, al relacionar dicha similitud fenotípica con la similitud funcional en GO (Gene Ontology) entre pares de genes, solo los fenotipos muy específicos se asociaron con anotaciones funcionales específicas. Dada la ausencia de correlación entre la similitud funcional y fenotípica de pares de genes anotados con términos funcionales y fenotípicos, se definieron las funciones celulares como grupos de términos GO co-ocurrentes, lo que permitió recuperar la relación entre la similitud fenotípica y la funcional. De forma análoga, definir los fenotipos como grupos de términos fenotípicos co-ocurrentes también permitió definir relaciones significativas entre los fenotipos y las funciones de los genes. Por tanto, con estas nuevas definiciones de fenotipo y función como entidades complejas y conexas, se observó que los genes con funciones celulares similares se relacionan con fenotipos similares; y que genes con fenotipos similares se relacionan con funciones similares. De este estudio se derivan varias implicaciones. La primera es aplicable en el ámbito experimental: la forma habitual de agrupar los perfiles fenotípicos –mediante métricas vectoriales– no parece ser la mejor de las aproximaciones para predecir la función de los genes, siendo una posible mejora considerar el contenido informativo de los fenotipos. La segunda implicación está relacionada con el proceso habitual de anotación funcional: en vez de agrupar los genes, se pueden agrupar los fenotipos según los genes anotados en ellos. El cálculo del enriquecimiento en términos funcionales de esos clústeres de fenotipos propicia la anotación de los genes también con las funciones con las que se relaciona. Esta aplicación es relevante para las tareas de anotación tanto en los procesos de curación de datos ya existentes como en los análisis de experimentos donde se estudien distintos fenotipos.