European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Article Category

Contenido archivado el 2023-04-17

Article available in the following languages:

Cómo identificar con rapidez y eficiencia conjuntos de datos genéticos voluminosos para colaborar con la investigación sobre el coronavirus

Un equipo internacional de investigadores está buscando la manera de ordenar y analizar cantidades ingentes de datos sobre secuencias genómicas para su uso en biomedicina.

Salud icon Salud

Gracias al avance de la tecnología de secuenciación, es posible producir grandes cantidades de datos de secuenciación del genoma correspondiente a varias especies. Es crucial examinar los datos pangenómicos (el conjunto de genes que poseen todos los miembros de una especie determinada), en concreto, en ámbitos como el estudio de bacterias y virus, la investigación de mecanismos de farmacorresistencia y el desarrollo de vacunas. Por ejemplo, ¿por qué el coronavirus es resistente a los fármacos habituales? ¿Pueden los datos masivos facilitar una rápida identificación de las características de estas nuevas cepas de virus? Con el apoyo del proyecto PANGAIA, financiado con fondos europeos, un grupo de investigadores aborda ahora este reto mediante el desarrollo de métodos para comparar conjuntos de datos genéticos muy voluminosos. Como se explica en una nota de prensa de la Universidad de Bielefeld, socia del proyecto PANGAIA, los científicos suelen utilizar un genoma de referencia para ver si el material genético de un organismo muestra variaciones concretas. «Combinan varios genomas de tal manera que exponen las características típicas de una especie entera. Así, los investigadores pueden comparar un nuevo virus de la gripe con un genoma de referencia que resume las características típicas de las cepas de virus de las que se origina». En la misma nota de prensa, Jens Stoye, catedrático de la Universidad de Bielefeld, afirma: «En estos casos, comparamos solamente dos genomas entre sí, por lo que las diferencias y similitudes son relativamente fáciles de identificar en el ordenador». Y añade: «Con el nuevo método, en un solo paso podemos comparar un genoma con miles de otros». Este proceso implica la pangenómica. «La nueva tecnología permite llevar a cabo un análisis simultáneo e integrado de muchas cepas del mismo organismo. Pueden ser virus, bacterias e incluso, a veces, organismos de orden superior». El profesor Stoye continúa: «Este sistema permite destacar las similitudes y diferencias entre los individuos de una especie. En el caso de los patógenos, a menudo es incluso posible comprender y predecir los procesos que condujeron al desarrollo de cepas particularmente infecciosas».

Anomalías genéticas

El nuevo método también puede usarse para detectar enfermedades hereditarias en humanos y para determinar anomalías genéticas, según la misma nota de prensa. «En los próximos años, queremos desarrollar nuevos algoritmos y estructuras de datos en colaboración con los socios del proyecto para que la pangenómica asistida por ordenador sea más rápida y fácil de usar», explica Alexander Schönhuth, también catedrático de la Universidad de Bielefeld. El equipo del proyecto espera desarrollar algoritmos en los que los ordenadores busquen similitudes y diferencias entre los genomas comparados y presenten los resultados mediante gráficos de variación. Estas representaciones permiten a los investigadores «identificar mutaciones completamente novedosas, como las que presumiblemente se han dado en la variante del coronavirus» que brotó en China y «ha creado resistencia a los medicamentos habituales», como señala el profesor Schönhuth. El proyecto PANGAIA (Pan-genome Graph Algorithms and Data Integration) está en curso y se prolongará hasta finales de diciembre de 2023. Se centrará en la representación basada en gráficos de grandes conjuntos de datos genómicos y demostrará sus ventajas respecto a la presentación tradicional de los datos pangenómicos basada en secuencias. «En este proyecto, este cambio de paradigma (de las representaciones de genomas basadas en secuencias a las basadas en gráficos) se aplicará plenamente», como se indica en CORDIS. «Como consecuencia, cabe esperar un gran número de ventajas de significación práctica, entre las que la disposición, el análisis, la compresión, la integración y la explotación de los datos del genoma son los puntos más fundamentales». Para obtener más información, consulte: Proyecto PANGAIA

Palabras clave

coronavirus

Países

Italia

Artículos conexos