European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-06-18

Semantic mining of phenotype associations from the biomedical literature

Article Category

Article available in the following languages:

Standardiser la terminologie relative au phénotype

Les progrès scientifiques, particulièrement en biologie moléculaire, ont contribué à l'amassement de grands volumes de données décrites selon différentes formes de phénotypes, entraînant des résultats fragmentés. Des fonds de l'UE ont soutenu plusieurs efforts visant à l'harmonisation de cette terminologie.

Santé icon Santé

Les nombreux efforts pour construire des terminologies standardisées sont limités en raison de l'ampleur et de la complexité des données issues de la documentation de base. L'alignement sémantique des ressources de données cliniques et biomédicales sur les maladies héréditaires pourrait aider les chercheurs et faciliterait l'intégration des données. Pour ce faire, le projet PHENOMINER (Semantic mining of phenotype associations from the biomedical literature) visait à utiliser des solutions de traitement de texte de pointe avec des ressources ontologiques existantes. Ces données pourraient être intégrées dans une représentation sémantique exploitable par les machines et accessible via une base de données publique. PHENOMINER a réussi à explorer les descriptions phénotypiques issues de la documentation scientifique stockées dans Europe PubMed Central et ont découvert des associations statistiques avec les maladies génétiques mendéliennes en utilisant une technologie d'exploration des données. La base de données OMIM (Online Mendelian Inheritance in man) et l'ontologie du phénotype humain sont quelques-unes des bases de données utilisées pour les procédures d'alignement et de comparaison. Dans l'ensemble, 4 898 phénotypes et 28 155 associations de trouble/phénotype, soit une collection impressionnante de bases de données, étaient conformes aux règles d'or en ce qui concerne la qualité. Les membres de l'équipe ont généré une base de données sémantiques de phénotypes automatiquement exploités et d'associations de troubles relatifs au phénotype, disponibles dans deux bases d'informations ouvertes et publiques: GitHub et Zenodo. Les formes de phénotypes utilisées et les associations innovantes des troubles OMIM pourraient être déterminées par les techniques PHENOMINER. Les résultats du projet ont entraîné 13 publications dans des revues scientifiques ainsi que des conférences et plusieurs activités de transfert de connaissances ont été entreprises. L'approche PHENOMINER et la base de données sont importantes aux chercheurs spécialisés dans les sciences de la vie et les cliniciens impliqués dans les études translationnelles ainsi qu'aux bioinformaticiens et aux responsables des bases de données. Les terminologies phénotypiques standardisées pourraient être utiles dans la découverte de nouvelles thérapies pour les maladies comme la sclérose en plaques et la maladie d'Alzheimer. De plus, cette approche hybride peut s'avérer utile dans les technologies sémantiques humaines, les sciences électroniques et l'extraction d'informations.

Mots‑clés

Phénotype, terminologie du phénotype, biomédical, exploration sémantique, ressources ontologiques

Découvrir d’autres articles du même domaine d’application