CORDIS - Resultados de investigaciones de la UE
CORDIS

Article Category

Article available in the following languages:

Establecer los pilares de las futuras bases de datos de dinámica molecular

Una nueva base de datos de simulaciones de dinámica molecular contribuirá a ahondar en el conocimiento científico de las proteínas víricas relacionadas con la COVID-19.

Salud icon Salud

Investigadores de Barcelona (España) han creado un repositorio de simulaciones de dinámica molecular (DM o MD, por sus siglas en inglés) gratuito y de acceso abierto llamado BioExcel-CV19. Esta base de datos, cuya creación ha sido respaldada por los proyectos financiados con fondos europeos MDDB y BioExcel-2 y BioExcel-3, contribuirá a esclarecer los mecanismos moleculares de la infección por el coronavirus del síndrome respiratorio agudo grave de tipo 2 (SARS-CoV-2). Sus características se describen en un artículo publicado en «Nucleic Acids Research». En todo el mundo se genera un enorme volumen de datos de simulaciones de DM, que analizan los movimientos físicos de átomos y moléculas. Sin embargo, la comunidad científica no siempre puede acceder a estos datos. Es más, hasta ahora, las iniciativas para hacer que los datos de DM sean seguros y reutilizables se han fundamentado en bases de datos sencillas, las cuales no ofrecen a los usuarios una verdadera solución, ya que solo proporcionan un conjunto limitado de análisis comunes sobre trayectorias cortas únicas. Por ello, los científicos necesitan una base de datos que posibilite efectuar análisis flexibles y que, además, tenga la capacidad para manipular sistemas de gran tamaño. Aquí es donde entra en juego BioExcel-CV19.

Un cambio en las bases de datos de DM

La plataforma ofrece a los científicos acceso a través de un portal web a trayectorias atomísticas en DM de macromoléculas implicadas en la COVID-19. La información esencial incluida en ella ofrece información de las funciones de proteínas clave del SARS-CoV-2, como la proteína de la espícula, la enzima convertidora de la angiotensina 2, el dominio de unión al receptor, la polimerasa, las nucleoproteínas y las proteínas de membrana. En agosto de 2023, la base de datos incluía ya más de diez mil trayectorias. Las trayectorias se presentan junto con una serie de análisis de control de calidad e información sobre el sistema. Todos los datos generados en el marco del proyecto se pueden descargar desde una interfaz de programación de aplicaciones de transferencia de estado representacional. En la plataforma se ha integrado asimismo la aplicación Jupyter Notebooks, que permite a los usuarios hacer metaanálisis personalizados. No hay requisitos de acceso para BioExcel-CV19, que es gratuito y está abierto a todos los usuarios. «Esta base de datos constituye un cambio en las bases de datos de DM, ya que está diseñada para manipular sistemas de gran tamaño y trayectorias largas y, al mismo tiempo, integrarse sin problemas con las simulaciones modernas de DM», explica en un comunicado de prensa de «EurekAlert !» el autor principal del estudio, el doctor. Modesto Orozco, del Instituto de Investigación Biomédica (IRB Barcelona), entidad coordinadora del proyecto MDDB y socio de los proyectos BioExcel-2 y BioExcel-3. A lo que añade: «Reúne trayectorias aportadas por diversos grupos de investigación, lo que promueve un método colaborativo para favorecer descubrimientos científicos». La base de datos repercutirá en ámbitos científicos como la virología, la genómica, la biología estructural y molecular, el diseño de fármacos, el aprendizaje automático y la simulación biomolecular. En lo que respecta a la simulación biomolecular, los científicos pueden utilizar la gran cantidad de datos disponibles en BioExcel-CV19 para mejor algoritmos y campos de fuerza de DM. Reanalizar y reutilizar datos crea oportunidades para llevar a cabo nuevos metaanálisis y descubrimientos. «El empleo de plataformas como BioExcel-CV19 debería convertirse en algo habitual, como ya sucede con Protein Data Bank en biología estructural», afirma el coautor del estudio, el doctor Adam Hospital, también del IRB Barcelona, que coordinó este trabajo junto con Orozco. El proyecto BioExcel-2 (BioExcel Centre of Excellence for Computational Biomolecular Research) finalizó en 2022, mientras que los proyectos MDDB (Molecular Dynamics Data Bank. The European Repository for Biosimulation Data) y BioExcel-3 (BioExcel Centre of Excellence for Computational Biomolecular Research) finalizarán en 2026. Para más información, consulte: Proyecto MDDB Página web del proyecto BioExcel

Palabras clave

MDDB, BioExcel-2, BioExcel-3, COVID-19, SARS-CoV-2, dinámica molecular, proteína, datos, base de datos, biomolecular

Artículos conexos