Comparative functional genomics and artificial neural networks for the study of the evolution of cis-regulation

  1. Firmpas Nisantzis, Panos
Dirigida por:
  1. José Luis Gómez Skarmeta Director
  2. Ignacio Maeso Martín Codirector

Universidad de defensa: Universidad Pablo de Olavide

Fecha de defensa: 22 de noviembre de 2019

Tribunal:
  1. Ana María Rojas Mendoza Presidenta
  2. Lorenzo Pasquali Secretario/a
  3. Jose Carlos Ribeiro Bessa Vocal

Tipo: Tesis

Teseo: 595656 DIALNET lock_openTESEO editor

Resumen

La regulación transcripcional es el primer y quizás más importante paso de la regulación génica, una compleja serie de dinámicas que, en última instancia, controla qué cantidad de producto génico se expresará en una célula en cada momento. Los distintos niveles de actividad transcripcional y la acumulación diferencial de tránscritos resultante conducen a la diferenciación celular, la piedra angular de la vida multicelular. La transcripción se regula mediante la interacción de distintas proteínas (factores en trans) que se unen al ADN en sitios específicos del genoma (elementos cis). Las primeras llamadas Factores de Trancripción y a los segundos Elementos Reguladores en Cis (TFs y CREs respectivamente, por sus siglas en inglés). Estudiada desde la perspectiva de la evolución genómica, la regulación transcripcional es excepcionalmente interesante. Los CREs pueden evolucionar con relativa rapidez y se considera que sus cambios son el motor principal de la evolución morfológica en animales. Así, una pequeña modificación que afecte a un sitio de unión de un TF durante el desarrollo embrionario podría dar lugar a efectos en cascada y alterar profundamente la forma del organismo. En este trabajo, nos enfrentamos a dos aspectos de este amplio campo de investigación. Para la primera parte del trabajo, investigaremos la evolución de la regulación en cis en el origen de los vertebrados. Para ello, empleamos el exhaustivo conjunto de datos genómicos, transcriptómicos y epigenómicos que generamos para el anfioxo mediterráneo (Branchiostoma lanceolatum). El anfioxo es un organismo ideal para tales investigaciones ya que, por varias razones tanto genómicas como morfológicas, se puede considerar que es el linaje existente que guarda una mayor similitud con el ancestro común de todos los cordados. Contrapondremos los datos de anfioxo con la igualmente extensa colección de datos que hemos generado para el pez cebra, así como con datos adicionales de peces medaka y de ratón. Para la segunda parte, nos centramos en el problema de identificar sitios de unión de TFs en el genoma. Aplicamos un enfoque matemático de vanguardia, una red de convolución o red neuronal (NN) que integra al mismo tiempo información de secuencia genómica con información de señal de ATACseq, para predecir con precisión sitios reales de unión de TFs usando únicamente experimentos de ATACseq. En este trabajo presentaremos nuestra NN y los resultados obtenidos al compararla con otras técnicas actuales. Estos resultados muestran que nuestro método puede resultar muy valioso en análisis genómicos actuales, ya que permite reemplazar con un solo experimento de ATACseq múltiples experimentos de ChIPseq, reduciendo de manera muy significativa los costes y el tiempo de los experimentos de secuenciación. Además, nuestra NN puede ser entrenada primero en una especie con datos de ChIPseq previamente disponibles y usarse después en otras especies diferentes, un enfoque que es particularmente atractivo para realizar comparaciones evolutivas, especialmente en el caso de nuevos organismos modelo.