Búsqueda y caracterización de señales de codificación de proteínas basado en similitudes no significativas

  1. Sánchez Casimiro-Soriguer, Carlos Federico
Dirigée par:
  1. Antonio J. Pérez-Pulido Directeur
  2. Juan Jiménez Co-directeur

Université de défendre: Universidad Pablo de Olavide

Fecha de defensa: 02 octobre 2020

Jury:
  1. Juan Antonio García Ranea President
  2. Ramón Ramos Barrales Secrétaire
  3. M Peña Chilet Rapporteur
Département:
  1. Biología Molecular e Ingeniería Bioquímica

Type: Thèses

Teseo: 609126 DIALNET lock_openRIO editor

Résumé

Desde que se secuenciaron las primeras secuencias genómicas con las denominadas tecnologías de primera generación hasta el momento actual donde se están implantando las tecnologías de secuenciación de tercera generación se ha producido un abaratamiento del coste que supone secuenciar el genoma completo de un organismo. Esto ha supuesto un gran aumento de los datos genómicos disponibles, generando la necesidad de la automatización del análisis para poder sacar el mayor provecho a toda esta información. En este sentido se han desarrollado aplicaciones capaces de localizar los genes presentes en secuencias biológicas. Estas aplicaciones incluso en genomas de procariotas, que poseen una menor complejidad con respecto a organismos eucariotas, no encuentran todas las secuencias codificantes de proteínas, y en especial si estas se corresponden con sORF, pseudogenes o genes no canónicos. Con el objetivo de solventar este problema, y permitir completar así el conjunto de genes de un genoma, se desarrolló AnABlast. Este algoritmo es capaz de localizar regiones codificantes de proteínas mediante el acúmulo de alineamientos no significativos, descartados habitualmente. En esta tesis se presenta el desarrollo y aplicación de AnABlast sobre genomas completos. Se han estudiado y optimizado los parámetros para mejorar la sensibilidad y especificidad y se han validado los resultados de posibles nuevos genes codificantes de proteínas en Caenorhabditis elegans mediante la técnica de RNA interferente. Asimismo, se ha desarrollado la segunda versión del anotador funcional Sma3s, que permite asignar funciones tanto a proteomas como a transcriptomas completos. En esta segunda versión se han reducido las dependencias, simplificado su uso, mejorado la sensibilidad y especificidad y reduciendo el tiempo de ejecución y los costes computacionales. Finalmente estas dos herramientas se han combinado en la aplicación web de AnABlast, facilitando de esta forma su uso y, por lo tanto, permitiendo a grupos experimentales completar la anotación de sus genomas de estudio.