Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Contenido archivado el 2024-06-18
Algorithms and Tools for Mining Biological Sequence Data

Article Category

Article available in the following languages:

Algoritmos para analizar las secuencias de ácidos nucleicos

La bioinformática se sirve de programas informáticos para analizar datos biológicos complejos. Las labores de secuenciación se están viendo favorecidas por unos métodos mejorados de procesamiento de datos relativos a las secuencias de ácidos nucleicos y proteínas que permiten superar las limitaciones actuales a este respecto.

La informática ha cambiado la forma en que se abordan cuestiones complejas en una variedad de campos, desde la automatización industrial destinada a la mecánica cuántica hasta la biomedicina. La bioinformática pretende encontrar una manera de relacionar la información genética —secuencias de ácidos nucleicos y proteínas— con el fenotipo —características, síntomas o alteraciones observables—. El proyecto dotado con fondos de la Unión Europea «Algorithms and tools for mining biological sequence data» (ALMOND) se creó con el fin de desarrollar nuevas técnicas para solventar diversos problemas significativos en el ámbito de la biología molecular computacional. La metodología en cuestión hace hincapié en métodos de programación dinámica con capacidad para identificar tanto los diferentes «subproblemas» sencillos que componen un problema de mayor dificultad como patrones recurrentes relacionados con los mismos y la correspondiente solución en los casos base. Los investigadores de ALMOND desarrollaron novedosos algoritmos que resultan eficaces a la hora de comparar secuencias de proteínas. El equipo se centró en una nueva variante especial de alineación de secuencia de recorrido restringido denominada alineación de secuencia con restricción regular en la expresión de recorrido («sequence alignment with regular expression path constraint», SA-REPC). Los investigadores ofrecieron dos nuevas soluciones para este problema de análisis de secuencias, ambas disponibles para su descarga en la página web del grupo anfitrión(se abrirá en una nueva ventana). El equipo también desarrolló novedosos algoritmos para la comparación de secuencias y estructuras de ARN en los casos en que estas secuencias se encuentren en una región codificante, tal y como sucede comúnmente en virus y bacterias. Estos métodos permiten elaborar predicciones relativas al antecesor común más probable de dos ARN, subsanando las limitaciones de los algoritmos que se emplean habitualmente para establecer comparaciones. Gracias a una serie de algoritmos, se abordaron varias cuestiones relacionadas con la secuenciación de nueva generación (SNG). El primer paso en muchos análisis de datos de SNG consiste en mapear lecturas cortas frente a un genoma de referencia. Unos novedosos métodos de mapeado que superan a los algoritmos existentes ofrecen mejoras sustanciales. Asimismo, una nueva estructura de datos de SNG relativa a una gráfica que se emplea en los métodos más prácticos de ensamblaje de genomas permite sortear uno de los principales obstáculos propios del procesamiento informatizado de datos. Este método, que genera un incremento en el espacio de memoria de entre un 30 y un 40 %, ya se está usando en un programa informático (Minia) de una entidad ajena a la iniciativa. La labor de ALMOND se materializó en nuevos algoritmos que solventan las carencias de los recursos que se emplean actualmente en el ámbito de la bioinformática y el análisis de secuencias. Estos y otros resultados han sido objeto de multitud de publicaciones. Además, el proyecto ha propiciado nuevas colaboraciones entre Francia e Israel. Por ende, se espera que la iniciativa tenga un impacto duradero en el campo de la bioinformática, una esfera de gran relevancia socioeconómica.

Descubra otros artículos del mismo campo de aplicación

Mi folleto 0 0