CORDIS - Forschungsergebnisse der EU
CORDIS

Semantic Indexing of French Biomedical Data Resources - mobility

Article Category

Article available in the following languages:

Offenes Web-Tool mit Annotationsfunktionen für biomedizinische Texte in französischer Sprache

Angesichts der wachsenden Menge biomedizinischer Daten werden Standardterminologien und -ontologien (semantische Indizierung) für die künftige datenbezogene wissenschaftliche Forschung benötigt. Im Rahmen des EU-finanzierten Projekts SIFRm wurde daher ein offenes Web-Tool mit Annotationsfunktionen für biomedizinische Texte in französischer Sprache entwickelt.

Digitale Wirtschaft icon Digitale Wirtschaft
Gesundheit icon Gesundheit

Für die Indexierung, Recherche und Abfrage biomedizinischer Informationen arbeiten Wissenschaftler mit Ontologien und Terminologien als gemeinsamem Nenner, wenn es um die Strukturierung von biomedizinischen Daten geht. Die meisten Tools sind jedoch nur in englischer Sprache verfügbar, trotz der großen Menge klinischer Daten, die in französischer Sprache generiert werden.

Biomedizinisches Annotationstool in französischer Sprache

Unterstützt durch das Marie-Skłodowska-Curie-Programm arbeitete das Projekt www.lirmm.fr/sifr (SIFRm) an einem Workflow für die ontologische Indexierung in weiteren EU-Sprachen, zunächst für Französisch. „Vor allem wollten wir die Annotation biomedizinischer Textdaten per Mausklick verfügbar machen und Forscher im Umgang mit Terminologien, Ontologien oder Spracherkennung entlasten“, erklärt Forschungsstipendiat Clement Jonquet. SIFRm war ein Kooperationsvorhaben zwischen der Forschergruppe um Prof. Cerris am Labor für Informatik, Robotik und Mikroelektronik in Montpellier (LIRMM), Frankreich, und der Gruppe um Prof. Musen am Stanford Center für biomedizinische Informatikforschung (BMIR) in den Vereinigten Staaten, das ontologiebasierte Dienste entwickelt. Die Forscher entwickelten den SIFR Annotator als frei zugänglichen Online-Service zur Analyse von Daten aus biomedizinischen Texten in französischer Sprache. Dabei werden reine Textpassagen vom Annotator mit relevanten biomedizinischen Ontologiekonzepten versehen und die Annotationen semantisch durch in Ontologien eingebettete Daten erweitert. Enthält ein Arztbericht etwa den Satz „keine Anzeichen für ein Melanom“, wird der Patient mittels semantischer Annotation als nicht relevant für Krebsstudien eingestuft. Zur Unterstützung des Dienstes entwickelte das Projekt das Ontologieverzeichnis SIFR BioPortal. Ähnlich wie die Technologie NCBO BioPortal der Stanford University stellt SIFR BioPortal Forschenden verschiedene Terminologien und Ontologien auf Französisch und mehrere ontologiebezogene Dienste zur Verfügung.

Kommentare zu klinischen Daten und agronomischen Sachverhalten

In Kooperation mit dem Projekt PractiKPharma wurde der SIFR Annotator erweitert, um klinische Daten zu analysieren und Erkrankungen mit Arztberichten in Kontext zu setzen. Für das Europäische Krankenhaus Georges Pompidou und das Universitätsklinikum Nancy entwickelten die Wissenschaftler spezifische Annotationsfunktionen für klinische Texte. Zudem führte SIFRm wissenschaftliche Methoden zusammen, um ein frei zugängliches Verzeichnis für agronomische Ontologien zu schaffen: AgroPortal wurde von der Forschungsgemeinschaft in Montpellier initiiert und von dem in Stanford tätigen Projektforscher abgeschlossen. Dabei orientierte sich das Forschungsteam an den wissenschaftlichen Ergebnissen und Erkenntnissen, die im biomedizinischen Kontext gewonnen wurden und entwickelte AgroPortal für die Landwirtschaft sowie verwandte Bereiche wie Lebensmittel-, Pflanzen- und Biodiversitätsforschung. „AgroPortal kommt dem Bedarf nach, semantische Ressourcen dieser Domäne über eine gemeinsame Plattform zu erstellen, verfügbar zu machen und zu strukturieren, sodass sie für die Agro-Informatik nutzbar sind“, berichtet Jonquet. Das Verzeichnis AgroPortal enthält derzeit über 110 Terminologieverzeichnisse oder Ontologien und wird noch erweitert. Die Plattform hat bereits mehr als 190 registrierte Nutzer, die sie mehrmals monatlich abfragen. Insgesamt lieferte SIFRm das erste frei zugängliche Web-Tool, das Entitäten erkennt und biomedizinische Texte in französischer Sprache kommentiert und kontextualisiert. Der Webdienst schneidet im Vergleich zu ähnlichen Annotationsplattformen gut ab und könnte damit die Arbeit vieler Wissenschaftlerinnen und Wissenschaftler wie auch klinischen und medizinischen Fachkräften effizienter machen. Pläne für künftige Partnerschaften mit Krankenhäusern und Forschungszentren in Frankreich werden den SIFR Annotator in der biomedizinischen Forschung etablieren. In ähnlicher Weise soll das AgroPortal-Tool im hauptsächlich von der französischen Nationalen Forschungsagentur finanzierten Projekt www.d2kab.org (D2KAB) Daten für die agrarwissenschaftliche und Biodiversitätsforschung zugänglich machen.

Schlüsselbegriffe

SIFRm, Biomedizin, Ontologie, Annotator, AgroPortal, BioPortal, französische Sprache, klinische Daten, Indexierung

Entdecken Sie Artikel in demselben Anwendungsbereich