Skip to main content
European Commission logo print header

Semantic mining of phenotype associations from the biomedical literature

Article Category

Article available in the following languages:

Una standardizzazione del vocabolario in materia di fenotipi

I progressi scientifici, in particolare riguardo alla biologia molecolare, hanno accumulato dati colossali, descritti mediante differenti forme di fenotipi, con la conseguenza di risultati biologici frammentati. Un finanziamento dell’UE ha sostenuto le attività per armonizzare tale vocabolario.

Salute icon Salute

Molti tentativi di costruire vocabolari standard in materia di fenotipi sono vincolati a causa dell’abbondanza e della complessità dei dati presenti nella letteratura primaria. L’allineamento semantico di risorse costituite da dati clinici e biomedici su malattie ereditarie sarebbe molto utile ai ricercatori, perché favorirebbe l’integrazione di dati. Per affrontare tale esigenza, il progetto PHENOMINER (Semantic mining of phenotype associations from the biomedical literature) si è proposto di utilizzare soluzioni d’avanguardia per l’elaborazione di testi insieme a risorse ontologiche esistenti. Tali dati potrebbero poi essere integrati in una rappresentazione semantica comprensibile da una macchina e l’accesso potrebbe avvenire tramite un database pubblico. PHENOMINER è riuscito a estrapolare descrizioni di fenotipi dalla letteratura scientifica archiviata in Europe PubMed Central e, utilizzando una tecnologia di estrapolazione di dati, ha rilevato associazioni statistiche con malattie mendeliane. Il database Online Mendelian Inheritance in man (OMIM) e l’ontologia del fenotipo umano sono alcuni dei database utilizzati come parametro di riferimento. Nel complesso, è stato rilevato che 4 898 fenotipi e 28 155 associazioni tra fenotipo e disturbo (un’imponente raccolta di dataset) sono sullo stesso livello di tali norme auree in termini di qualità. I componenti del team sono riusciti a generare un database semantico di fenotipi estrapolati automaticamente e associazioni tra fenotipo e disturbo, disponibili in due archivi pubblici ad accesso libero: GitHub e Zenodo. Le forme di fenotipo utilizzate comunemente e le nuove associazioni con disturbi OMIM potrebbero essere determinate attraverso tali tecniche PHENOMINER. Le conclusioni del progetto hanno prodotto 13 pubblicazioni in articoli di giornali, mentre sono state organizzate conferenze e varie attività di trasferimento delle conoscenze. L’approccio e il database PHENOMINER sono di grande rilevanza per gli studiosi di scienze biologiche e i clinici che si occupano di studi traslazionali, oltre che per bioinformatici e curatori di database. I vocabolari fenotipici standardizzati potrebbero dimostrarsi determinanti per la scoperta di nuove terapie per malattie come l’Alzheimer e la sclerosi multipla. Inoltre, questo approccio ibrido potrebbe risultare utile anche nelle tecnologie del linguaggio umano, nelle scienze digitali e nel reperimento delle informazioni.

Parole chiave

Fenotipo, vocabolario in materia di fenotipi, biomedico, estrapolazione semantica, risorse ontologiche

Scopri altri articoli nello stesso settore di applicazione