Influence of alignment uncertainty on homology and phylogenetic modeling
- Chang, Jia-Ming
- Cedric Notredame Director/a
Universidad de defensa: Universitat Pompeu Fabra
Fecha de defensa: 25 de julio de 2013
- María del Mar Alba Soler Presidente/a
- Fernando Cores Prado Presidente/a
- Ana María Rojas Mendoza Secretaria
- Arcadi Navarro Cuartiellas Vocal
Tipo: Tesis
Resumen
La mayoría de los análisis evolutivos están basados en modelos establecidos de alineamiento de secuencia múltiple. Desde un punto de vista computacional, es igual de complejo la estimación de un alineamiento correcto, como la obtención de un árbol correcto a partir del alineamiento. Recientemente varios trabajos han informado sobre la influencia del alineamiento en los análisis posteriores, y en la incertidumbre inherente a su estimación. El Capítulo 1 desarrolla el concepto de incertidumbre de alineación, tanto inherente a los datos (internos), como resultante de los sesgos metodológicos (externo). El Capítulo 2 presenta dos contribuciones mías para la mejora de los métodos de MSA a través del uso de la extensión de homología (TM-Coffee) [1] y gracias a un algoritmo de coincidencia de palabra mejorado (SymAlign) [2]. En el capítulo 3, se muestra cómo la incertidumbre de alineación puede ser utilizada para mejorar la confiabilidad del análisis filogenético. El capítulo 4 nos muestra como se puede obtener una mejora similar por medio de una simple adaptación de la puntuación transitiva del T-Coffee [3], lo cual permite un análisis posterior para tener en cuenta la incertidumbre de alineación interna. El último capítulo contiene un análisis de los resultados actuales y los posibles futuros trabajos. referencia 1. Lin HN, Notredame C, Chang JM, Sung TY, Hsu WL: Improving the alignment quality of consistency based aligners with an evaluation function using synonymous protein words. PLoS One 2011, 6(12):e27872. 2. Chang J-M, Di Tommaso P, Taly J-Fß, Notredame C: Accurate multiple sequence alignment of transmembrane proteins with PSI-Coffee. BMC Bioinformatics 2012, 13(Suppl 4). 3. Notredame C, Higgins DG, Heringa J: T-Coffee: A novel method for fast and accurate multiple sequence alignment. J Mol Biol 2000, 302(1):205-217.