Uso de rutas metabólicas para la validación de redes genéticas de asociación

  1. Gómez-Vela, Francisco Antonio
Dirigida por:
  1. Norberto Díaz-Díaz Director

Universidad de defensa: Universidad Pablo de Olavide

Fecha de defensa: 29 de mayo de 2015

Tribunal:
  1. José Cristobal Riquelme Santos Presidente/a
  2. Domingo Savio Rodríguez Baena Secretario
  3. Laura Furlong Vocal
Departamento:
  1. Deporte e Informática

Tipo: Tesis

Teseo: 381058 DIALNET lock_openRIO editor

Resumen

PLANTEAMIENTO El uso de computadores en tareas de investigación es una constante en multitud de disciplinas. Concretamente, es conocido que en los últimos años el campo de la biología molecular, y la genética en particular, ha sufrido un gran auge con proyectos tan ambiciosos como la descodificación del genoma humano. Este auge trajo consigo la necesidad de analizar y representar ingentes volúmenes de datos. Con tal fin, se recurrieron a los sistemas de información para aplicar técnicas propias de Minería de Datos, que se fueron especializando y que llegaron a formar parte de un nuevo campo interdisciplinar denominado Bioinformática. La Bioinformática se basa en el uso de bases de datos y algoritmos con el objetivo de analizar proteínas, genes, y colecciones completas de ácido desoxirribonucleico (ADN) de un organismo (genoma). La llegada de la Bioinformática ha propiciado un avance considerable en el estudio de los sistemas biológicos y las relaciones genéticas en particular. En este sentido, aparecen las Redes Genéticas (RG) como método de representación de la información de las relaciones entre genes. Éstas se suele representan en forma de grafo, lo que hace que resulte muy sencilla su interpretación y potente en la información que representa. Debido a ello, el uso de RGs es generalizado en el campo de la Bioinformática, especialmente para el análisis de datos de expresión génica. Por otra parte, y gracias al esfuerzo de la comunidad científica, en la actualidad disponemos de una serie de repositorios públicos de información biológica. Estos repositorios contienen una fuente de conocimiento biológico que puede ser aprovechado desde diferentes puntos de vista. Por un lado, en apoyo de decisiones para la generación de nuevos modelos biológicos. Y por otro lado, en la validación, desde un punto de vista biológico, de modelos generados por algoritmos En este contexto, el punto de partida de esta tesis es el nuevo marco que se abre para las ciencias de la computación, concretamente en la Bioinformática, con la necesidad incipiente del diseño de técnicas automáticas de generación y validación de nuevo conocimiento biológico. Y para ello, en este trabajo se explotará el conocimiento ofrecido por los repositorios públicos de información biológica. OBJETIVOS PERSEGUIDOS EN LA TESIS Este trabajo se centra en el uso del conocimiento biológico previo para la validación de modelos biológicos generados de información de expresión génica proporcionada por diferentes tecnologías como, por ejemplo, la tecnología microarray. El objetivo principal de esta tesis se basará en la implementación de un nuevo enfoque para la validación de redes genéticas basado en el conocimiento biológico almacenado en repositorios públicos. Este objetivo a su vez se subdivide en los siguientes sub-objetivos: * Analizar los enfoques actuales para la validación de redes genéticas y diseñar e implementar una nueva medida de validación de redes genéticas que soluciones los problemas que presentan los enfoques actuales. Las técnicas actuales para la validación de redes genéticas se basan en una comparación directa de las relaciones que componen dichas redes con las relaciones presentes en lo que se denomina un "gold-standard". Esta comparación directa no resulta completamente fiable, ya que, deja de lado las relaciones débiles presentes en las redes genéticas. Debido a ello, la nueva aproximación tendrá en cuenta dichas relaciones para la evaluación de las redes. * En otro sentido, la nueva medida se apoyará en un repositorio biológico público de calidad contrastada como gold-standard, concretamente este repositorio sería Kyoto Encyclopedia of Genes and Genomes (KEGG) . Los datos almacenados en KEGG están organizados en rutas metabólicas, que al fin y al cabo son redes de interacción física entre diferentes elementos macromoleculares. Estas rutas metabólicas almacenadas en KEGG presentan un nivel de abstracción diferente al de las redes de asociación. Por ello, se diseñará una conversión de dicha información para elevar su nivel de abstracción al de las redes de asociación.