European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Contenido archivado el 2024-06-18

Semantic mining of phenotype associations from the biomedical literature

Article Category

Article available in the following languages:

Una estandarización del vocabulario del fenotipo

Los progresos científicos, en concreto en el ámbito de la biología molecular, han generado una cantidad colosal de datos que se describen mediante distintas formas de fenotipo y que provocan fragmentación en los resultados científicos biológicos. Una iniciativa de la Unión Europea se propuso homogeneizar este vocabulario.

Salud icon Salud

Gran cantidad de iniciativas destinadas a generar vocabularios del fenotipo estandarizados se enfrentan al impedimento que suponen la enorme cantidad y complejidad de los datos extraídos de las fuentes bibliográficas primarias. El alineamiento semántico de los recursos de datos biomédicos dedicados a enfermedades hereditarias impulsará la labor científica al facilitar la integración de los datos. El proyecto PHENOMINER (Semantic mining of phenotype associations from the biomedical literature) combinó tecnologías de procesamiento de textos de última generación con recursos ontológicos preexistentes. Los datos procesados de este modo se integrarían así en una representación semántica interpretable por máquinas a través de una base de datos. PHENOMINER extrajo descripciones de fenotipo de la bibliografía científica archivada en Europe PubMed Central y descubrió cuatro asociaciones estadísticas con enfermedades mendelianas mediante tecnología de minería de datos. La base de datos Online Mendelian Inheritance in Man (OMIM) y la ontología del fenotipo humano fueron dos de las bases de datos utilizadas en la evaluación comparativa. Se descubrió que 4 898 fenotipos y 28 155 asociaciones con trastornos del fenotipo, una cantidad extraordinaria de corpus, estaban a la altura de estos estándares de referencia en cuanto a calidad. Los miembros del equipo generaron bases de datos semánticas de fenotipos sometidos a minería automática y asociaciones con trastornos del fenotipo que publicaron en dos repositorios de libre acceso: GitHub y Zenodo. Mediante estas técnicas desarrolladas por PHENOMINER se pudieron determinar formas de fenotipo comúnmente empleadas y nuevas asociaciones con trastornos OMIM. Los resultados del proyecto generaron trece publicaciones en revistas científicas, varias ponencias en congresos y actividades de transferencia de conocimientos. El método de PHENOMINER y su base de datos poseen relevancia para investigadores dedicados a las ciencias de la vida y médicos inmersos en estudios traslacionales así como para bioinformáticos y responsables de bases de datos. Los vocabularios fenotípicos estandarizados podrían resultar fundamentales en el descubrimiento de terapias nuevas para tratar enfermedades como la de Alzheimer y la esclerosis múltiple. Es más, este método híbrido también puede tener aplicación en las tecnologías del lenguaje humano, la ciencia electrónica y la extracción de información.

Palabras clave

Fenotipo, vocabulario del fenotipo, biomédico, minería semántica, recursos ontológicos

Descubra otros artículos del mismo campo de aplicación