Skip to main content
European Commission logo print header

Rapid development and distribution of statistical tools for high-throughput sequencing data

Article Category

Article available in the following languages:

Una plataforma informática para procesar datos genómicos

Los avances recientes en la secuenciación del ADN y el ARN han transformado el campo de la genómica, al ser posible ya generar grandes volúmenes de datos de forma rápida y barata. Ahora, gracias a fondos europeos, unos investigadores han desarrollado las herramientas estadísticas necesarias para poder analizar los cientos de gigabytes de datos resultantes de cada tanda de secuenciación.

Tecnologías industriales icon Tecnologías industriales

Los progresos logrados desde la primera secuenciación de un genoma humano hasta la era naciente de la medicina de base genómica se deben a la secuenciación de alto rendimiento (HTS). Gracias a esta tecnología es posible la secuenciación rápida de grandes segmentos de pares de bases de ADN y ARN, abarcando así todo el genoma. No obstante, para extraer señales biológicas de utilidad, la HTS necesita de herramientas estadísticas potentes y eficientes en el plano informático. El proyecto financiado con fondos europeos RADIANT (Rapid development and distribution of statistical tools for high-throughput sequencing data) se puso en marcha con la meta de mejorar las herramientas de análisis de datos más extendidas. Su objetivo definitivo era integrar paquetes de software desarrollados por investigadores en Francia, Alemania, Italia, Suiza y Reino Unido en un único marco informático. Por ejemplo, existe el banco Phyton HTSeq, que realiza un procesamiento previo de los datos de secuenciación del ARN para efectuar un análisis de la expresión génica diferencial. En el paquete DESequ2 hay métodos para detectar los genes expresados de forma diferencial por medio de modelos lineales generalizados. Por otro lado, el paquete BitSeqVB aplica una estrategia bayesiana para deducir la concentración de transcriptos de ARN mensajero. La investigación realizada en el marco del proyecto RADIANT abarcó todos los aspectos del análisis de datos de la HTS, desde el control de la calidad hasta la visualización de los datos. Se propuso un modelo bayesiano jerárquico para la serie histórica de expresión génica, el cual puede agregar los datos que falten tanto de forma sistemática como aleatoria. El buscador genómico de RADIANT es la primera herramienta de visualización desarrollada para los datos de metilación del ADN. La mayoría de las herramientas se han integrado en Bioconductor, brindando así un marco uniforme para el análisis de datos de la HTS, su documentación y su distribución. No obstante, Bioconducir contiene un número muy elevado de paquetes, y para los usuarios inexpertos esto supone un escollo de cara a solucionar problemas específicos. Por ello se creó una guía para principiantes que ofrece una introducción sencilla pero exhaustiva al análisis de datos de secuenciación de ARN. Las tecnologías de secuenciación ofrecen una visión ilimitada del genoma humano, y por ello se han extendido prácticamente por todas las ramas de la investigación biológica y médica. Ahora, gracias a las herramientas creadas en RADIANT, el análisis de datos de HTS se afianzará como un recurso indispensable. Se prevé que sus amplias aplicaciones transformen la ciencia genómica y revelen información hasta ahora inimaginable.

Palabras clave

Secuenciación de ARN, genómica, genoma humano, herramientas estadísticas, secuenciación de alto rendimiento, análisis de datos

Descubra otros artículos del mismo campo de aplicación