Desarrollo de herramientas y protocolos bioinformáticos para la búsqueda de proteínas ortólogas y su aplicación en análisis evolutivos

  1. Mier Muñoz, Pablo
Dirigida por:
  1. Antonio J. Pérez-Pulido Director

Universidad de defensa: Universidad Pablo de Olavide

Fecha de defensa: 04 de noviembre de 2014

Tribunal:
  1. Juan Jiménez Martínez Presidente/a
  2. Ana María Rojas Mendoza Secretaria
  3. Miguel Angel Andrade Navarro Vocal
Departamento:
  1. Biología Molecular e Ingeniería Bioquímica

Tipo: Tesis

Teseo: 371694 DIALNET lock_openRIO editor

Resumen

Las proteínas homólogas son aquellas que tienen un origen evolutivo común. Cuando éstas son funcionalmente equivalentes y se encuentran en dos especies diferentes procedentes de un proceso de especiación, se habla específicamente de ortólogos. El uso bioinformático de las proteínas ortólogas es muy extendido, siendo útiles para procesos diversos como predecir funciones de nuevas secuencias o realizar ensayos ómicos. La anotación de proteínas ortólogas se realiza principalmente de forma manual, siendo necesario el desarrollo de nuevas herramientas y protocolos bioinformáticos que faciliten esta tarea. En este marco se engloba el Proyecto de Tesis presente, en el que se desarrolla una nueva herramienta de búsqueda de proteínas ortólogas, y se llevan a cabo una serie de análisis particulares con diferentes objetivos biológicos. En primer lugar, se complementó la anotación de proteínas SMN fúngicas de forma manual a partir de datos de organismos completamente secuenciados. Hasta la fecha de comienzo de este trabajo (Octubre de 2010), sólo una proteína fúngica había sido anotada como SMN, perteneciente a Schizosaccharomyces pombe. La ausencia tanto de esta proteína como de su parálogo SPF30 en Saccharomyces cerevisiae había llevado a postular su relación con el bajo número de intrones de esta levadura. La distribución evolutiva de SMN parece estar relacionada con que al menos parte de su ciclo de vida sea en forma filamentosa. Se certifica además la hipótesis de que genomas fúngicos con alto número de intrones por gen presentan SMN, o al menos su parálogo SPF30. Ante la cantidad de trabajo que supone la búsqueda de ortólogos de forma manual en conjuntos grandes de proteomas, se ideó una herramienta para la detección automática de proteínas homólogas, y ortólogas específicamente, que trasladada a un algoritmo rápido y robusto, provee de resultados fiables al usuario. El programa que alberga tal estrategia se denomina orthoFinder, y está implementado en forma de aplicación web de libre acceso. Se provee a orthoFinder con una interfaz gráfica sencilla que facilita su uso. Posteriormente, esta herramienta desarrollada se probó con la proteína Mpg1 de Schizosaccharomyces pombe. Ésta es una proteína esencial para el mantenimiento de la estructura de la pared celular y para el crecimiento celular. En el proyecto de investigación en el que se encuadra esta colaboración, se aisló un parálogo de esta proteína, nombrada como Mpg2. La caracterización bioinformática de Mpg2 apoya el hecho de que sea paráloga de Mpg1. Mediante la búsqueda de ortólogos de Mpg2 que se realiza con orthoFinder se constata que Mpg2 está presente en la mayoría de los organismos modelo. Sin embargo, una búsqueda centrada en Fungi evidencia que no todos los organismos fúngicos con Mpg1 presentan Mpg2. En último lugar, en un trabajo realizado en una estancia en el Max Delbrück Center for Molecular Medicine de Berlín, se realizó un análisis evolutivo detallado de la familia de proteínas YRG. Esta familia se caracteriza por ser un grupo de GTPasas permutadas circularmente. Son proteínas esenciales requeridas para el ensamblaje de subunidades ribosomales, siendo necesaria su presencia en todos los compartimentos con actividad ribosomal. De esta forma, se plantea la posibilidad del uso de esta familia como marcador de la evolución de compartimentos tales como núcleo, mitocondria o plastos. La localización de todos los homólogos de la familia en un total de 171 organismos (32 Bacterias, 93 Arqueas y 46 Eucariotas) se realizó por medio de orthoFinder, y se comprobaron manualmente. El patrón de presencia de estas proteínas demuestra que la familia YRG puede usarse como marcador de la evolución de los compartimentos. El estudio de características tales como la longitud y las proporciones de distintos aminoácidos, además, sirve para constatar que la evolución de las proteínas depende de su compartimentalización.