Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Article Category

Contenido archivado el 2023-03-01

Article available in the following languages:

Las bases de datos internacionales de ADN y ARN logran un hito muy importante

Los tres miembros que forman la colaboración internacional para la base de datos de secuencias de nucleótidos (INSDC, en sus siglas en inglés) han anunciado que los archivos de información sobre secuencias de ADN y ARN contienen ahora más de 55 millones de secuencias, el equiv...

Los tres miembros que forman la colaboración internacional para la base de datos de secuencias de nucleótidos (INSDC, en sus siglas en inglés) han anunciado que los archivos de información sobre secuencias de ADN y ARN contienen ahora más de 55 millones de secuencias, el equivalente a 100 gigabases o, lo que es lo mismo, cien mil millones de componentes moleculares del ADN que codifican la información genética. Los tres miembros, el Banco EMBL (con sede en el instituto europeo de bioinformática del laboratorio europeo de biología molecular en Hinxton, Reino Unido), GenBank en EEUU y el Banco de datos de DNA de Japón, han alcanzado este hito juntos, gracias a su política de intercambio de datos. Las tres organizaciones comparten todos sus datos sobre secuencias a través del intercambio mundial de información biológica con el fin de que cada secuencia de nucleótido pueda ser de domino público y estén disponibles gratuitamente para la comunidad científica con la mayor cerelidad. Las cuatro bases, adenina (A), timina (T), guanina (G) y citosina (C), unidas en pares, forman una larga cadena para constituir la ahora conocida doble hélice del ácido desoxirribonucleico (ADN). Los vínculos entre los pares de bases, con A vinculada a T y C a G vía los enlaces de hidrógeno, pueden ser rotos para "desmontar" las dos cadenas de la doble hélice. La información genética está codificada en el ADN según el orden en que las bases aparecen en la secuencia. Convencionalmente, las secuencias pueden ser descritas simplemente enumerando el orden de bases únicas (o nucleótidos) sobre una de las dos cadenas (por ejemplo, CCAAATATGGATT) y esto, junto con las anotaciones que identifican las especies de origen y la función, es el tipo de información que contiene las bases de datos de INSDC. Graham Cameron, director asociado del Instituto europeo de bioinformática del EMBL ha dicho que "este es un hito importante en la historia de las bases de datos de secuencias de nucleótidos, desde que se produjera la primera entrada en la Biblioteca de datos EMBL en 1982 hasta las más de 55 millones de secuencias de al menos 200.000 organismos diferentes que hoy se tienen. Estos recursos han planteado las necesidades de los biólogos moleculares y les han hecho trabajar con frecuencia en situaciones serias de escasez de recursos discursos". El INSC se formalizó en febrero de 1987, y las tres bases de datos tienen sus raíces en los años 80: el banco EMBL, ahora en el EBI del Reino Unido, fue lanzado inicialmente en la Biblioteca de datos del EMBL (laboratorio europeo de biología molecular) en Heidelberg, Alemania; el GenBank de EEUU, que surgió poco después en el laboratorio nacional de Los Alamos, antes de trasladarse al centro nacional de información biotecnológica en Bethesda, EEUU; y el Banco de datos de ADN de Japón, creado en el instituto nacional de genética en Mishima, en 1986. David Lipman, director del centro nacional para la información biotecnología explicó que "las bases de datos de secuencias de nucleótidos permiten hoy en día a los investigadores compartir genomas completos, la reconstrucción genética de ecosistemas enteros, y las secuencias asociadas con las patentes". Inicialmente, los datos fueron distribuidos sobre cinta magnética o en un disquete y se introdujeron manualmente. Ahora se han sustituido por enlaces informáticos a partir de los proyectos de secuenciación del genoma y la Oficina Europea de Patentes, garantizando que todas las secuencias de dominio público estén disponibles con la mayor rapidez posible. Los investigadores pueden presentar también sus datos directamente a cualquiera de las organizaciones y, debido a que los modelos de las tres bases están armonizados, las secuencias se intercambian de forma automática durante la noche permitiendo la disponibilidad de los datos en las tres. Inicialmente las secuencias se introdujeron manualmente a partir de la información contenida en las revistas científicas, pero el proceso ha evolucionado con los años de forma que la presentación directa de secuencias de nucleótidos a las bases de datos se ha convertido en parte del proceso de publicación. Este principio se aplica también a otras áreas, como en el análisis proteómico y los modelos de procesos biológicos. "El INSDC ha establecido las bases para el intercambio de muchos tipos de información biológica", declaró Takashi Gojobori, director del centro de información biológica y del banco de datos de ADN de Japón. "Conforme entramos en la era de la biología de sistemas y los investigadores comienzan a intercambiar complejos tipos de información, como los resultados de experimentos que miden las actividades de miles de genes, o modelos informáticos de procesos completos, es importante que celebremos los logros de estas tres bases de datos que son pioneras en el intercambio abierto de información biológica".