Búsqueda y caracterización de señales de codificación de proteínas basado en similitudes no significativas

  1. Sánchez Casimiro-Soriguer, Carlos Federico
Dirigida por:
  1. Antonio J. Pérez-Pulido Director
  2. Juan Jiménez Codirector

Universidad de defensa: Universidad Pablo de Olavide

Fecha de defensa: 02 de octubre de 2020

Tribunal:
  1. Juan Antonio García Ranea Presidente/a
  2. Ramón Ramos Barrales Secretario
  3. M Peña Chilet Vocal
Departamento:
  1. Biología Molecular e Ingeniería Bioquímica

Tipo: Tesis

Teseo: 609126 DIALNET lock_openRIO editor

Resumen

Desde que se secuenciaron las primeras secuencias genómicas con las denominadas tecnologías de primera generación hasta el momento actual donde se están implantando las tecnologías de secuenciación de tercera generación se ha producido un abaratamiento del coste que supone secuenciar el genoma completo de un organismo. Esto ha supuesto un gran aumento de los datos genómicos disponibles, generando la necesidad de la automatización del análisis para poder sacar el mayor provecho a toda esta información. En este sentido se han desarrollado aplicaciones capaces de localizar los genes presentes en secuencias biológicas. Estas aplicaciones incluso en genomas de procariotas, que poseen una menor complejidad con respecto a organismos eucariotas, no encuentran todas las secuencias codificantes de proteínas, y en especial si estas se corresponden con sORF, pseudogenes o genes no canónicos. Con el objetivo de solventar este problema, y permitir completar así el conjunto de genes de un genoma, se desarrolló AnABlast. Este algoritmo es capaz de localizar regiones codificantes de proteínas mediante el acúmulo de alineamientos no significativos, descartados habitualmente. En esta tesis se presenta el desarrollo y aplicación de AnABlast sobre genomas completos. Se han estudiado y optimizado los parámetros para mejorar la sensibilidad y especificidad y se han validado los resultados de posibles nuevos genes codificantes de proteínas en Caenorhabditis elegans mediante la técnica de RNA interferente. Asimismo, se ha desarrollado la segunda versión del anotador funcional Sma3s, que permite asignar funciones tanto a proteomas como a transcriptomas completos. En esta segunda versión se han reducido las dependencias, simplificado su uso, mejorado la sensibilidad y especificidad y reduciendo el tiempo de ejecución y los costes computacionales. Finalmente estas dos herramientas se han combinado en la aplicación web de AnABlast, facilitando de esta forma su uso y, por lo tanto, permitiendo a grupos experimentales completar la anotación de sus genomas de estudio.