Skip to main content

Article Category

Article available in the folowing languages:

Uno strumento online aperto per l’annotazione di testo biomedico in lingua francese

In considerazione del costante aumento del volume dei dati biomedici, si avverte l’impellente necessità di utilizzare terminologie e ontologie (indicizzazioni semantiche) comuni per guidare le future scoperte scientifiche basate sui dati. Uno strumento online aperto sviluppato dal progetto europeo SIFRm fornisce annotazione di testo biomedico in testi in lingua francese.

Economia digitale
Salute

Gli scienziati utilizzano ontologie e terminologie per indicizzare, estrarre e recuperare informazioni biomediche. L’uso di ontologie e terminologie funge da comune denominatore per strutturare i dati biomedici. Tuttavia, la maggior parte degli strumenti sono in lingua inglese, e nonostante la grande quantità di dati clinici prodotti in francese, la tecnologia facilmente reperibile è scarsa.

Uno strumento di annotazione biomedica in lingua francese

Condotto con il supporto del programma Marie Skłodowska-Curie (MSCA), l’obiettivo del progetto SIFRm era quello di costruire un flusso di lavoro di indicizzazione basato sull’ontologia specializzato per altre lingue dell’UE, a partire dal francese. «Il nostro obiettivo principale era quello di rendere l’annotazione di dati testuali biomedici disponibile a portata di clic per sgravare i ricercatori dall’onere di occuparsi di terminologie e ontologie o dell’elaborazione del linguaggio naturale», spiega il borsista MSCA Clement Jonquet. SIFRm è stato frutto di una collaborazione tra il team del prof. Cerri presso il Laboratorio di informatica, robotica e microelettronica di Montpellier (LIRMM) in Francia e il team del prof. Musen presso il Centro per la ricerca informatica biomedica (BMIR) di Stanford negli Stati Uniti, riconosciuti per lo sviluppo di servizi basati sull’ontologia. I ricercatori hanno costruito SIFR Annotator, un servizio online accessibile al pubblico che consente l’elaborazione di dati testuali biomedici in francese. L’annotatore, in sostanza, etichetta testo grezzo con i relativi concetti di ontologia biomedica ed espande le annotazioni dal punto di vista semantico utilizzando le conoscenze incorporate nelle ontologie. Ad esempio, se una nota clinica contiene la frase «nessun segno di melanoma», l’annotazione semantica aiuterà a classificare il paziente come non pertinente per studi sul cancro. Per supportare il servizio, il progetto ha sviluppato l’archivio di ontologia SIFR BioPortal. Simile alla tecnologia NCBO BioPortal sviluppata presso l’Università di Stanford, SIFR BioPortal ospita diverse terminologie e ontologie in francese, offrendo alla comunità svariati servizi legati all’ontologia.

Annotare dati clinici ed entità agronomiche

In collaborazione con il progetto PractiKPharma, SIFR Annotator è stato arricchito per elaborare dati clinici e per contestualizzare malattie in note cliniche. Gli scienziati hanno sviluppato funzionalità specifiche per l’annotazione di testi clinici, rispondendo alle esigenze dell’Ospedale Europeo Georges Pompidou e dell’Ospedale dell’Università di Nancy. Inoltre, SIFRm ha generalizzato i metodi scientifici per costruire un archivio aperto per le ontologie agronomiche chiamato AgroPortal, uno sforzo comunitario avviato dalla comunità scientifica di Montpellier e ultimato tramite la mobilità dei ricercatori a Stanford. Sulla base dei risultati scientifici e dell’esperienza del dominio biomedico, gli scienziati hanno sviluppato AgroPortal per l’agronomia e per domini affini quali l’alimentazione, la fitologia e la biodiversità. «AgroPortal risponde alle esigenze di una piattaforma comune per ospitare, costituire e allineare risorse semantiche disponibili in questo dominio, consentendo il loro utilizzo in applicazioni agroinformatiche», riferisce Jonquet. L’archivio AgroPortal attualmente ospita più di 110 vocabolari o ontologie e sarà ulteriormente arricchito nel prossimo futuro. La piattaforma conta già più di 190 utenti registrati con visite frequenti ogni mese. Nel complesso, il progetto SIFRm ha fornito il primo strumento online apertamente accessibile per il riconoscimento delle entità e per l’annotazione e la contestualizzazione di testi biomedici francesi. Il servizio online ha buoni risultati di performance se confrontato con altre piattaforme di annotazione e dovrebbe migliorare il lavoro di una vasta gamma di scienziati, tra cui medici, operatori sanitari e ricercatori. Progetti per partenariati futuri con ospedali e centri di ricerca in Francia espanderanno l’utilizzo di SIFR Annotator nella ricerca biomedica. In uno sforzo analogo, lo strumento AgroPortal sarà utilizzato nel progetto D2KAB primariamente finanziato dall’Agenzia di ricerca nazionale francese per trasformare i dati in conoscenze nel campo dell’agronomia e della biodiversità.

Parole chiave

SIFRm, biomedico, ontologia, annotatore, AgroPortal, BioPortal, lingua francese, dati clinici, indicizzazione

Scopri altri articoli nello stesso settore di applicazione