European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Semantic Indexing of French Biomedical Data Resources - mobility

Article Category

Article available in the following languages:

Otwarte narzędzie internetowe do adnotacji francuskich tekstów biomedycznych

Przy nieustannym wzroście ilości danych biomedycznych niezbędne jest stosowanie standardowych terminologii i ontologii (indeksacji semantycznej) w celu ukierunkowania przyszłych odkryć naukowych opartych na danych. Otwarte narzędzie internetowe opracowane w ramach europejskiego projektu SIFRm umożliwia adnotację tekstu biomedycznego w tekstach w języku francuskim.

Gospodarka cyfrowa icon Gospodarka cyfrowa
Zdrowie icon Zdrowie

Naukowcy wykorzystują ontologie i terminologie do indeksowania, wydobywania i wyszukiwania informacji biomedycznych. Ontologia i terminologia pozwalają na strukturyzowanie tych danych. Jednakże językiem obsługi większości narzędzi jest język angielski i pomimo dużej ilości danych klinicznych w języku francuskim, brakuje łatwo dostępnych technologii.

Narzędzie do adnotacji biomedycznej danych w języku francuskim

Celem projektu www.lirmm.fr/sifr (SIFRm), realizowanego przy wsparciu działania „Maria Skłodowska-Curie”, było zbudowanie opartego na ontologii systemu indeksowania, działającego w innych językach UE. Pierwszym z nich był francuski. „Naszym głównym celem było udostępnienie adnotacji biomedycznych danych tekstowych jednym kliknięciem myszy, aby uwolnić naukowców od uciążliwych kwestii związanych z terminologią i ontologią oraz przetwarzaniem języka naturalnego”, wyjaśnia Clement Jonquet, stypendysta działania „Maria Skłodowska-Curie”. Projekt SIFRm był oparty na współpracy zespołu profesora Cerriego z Laboratorium Informatyki, Robotyki i Mikroelektroniki w Montpellier (LIRMM) we Francji i zespołu profesora Musena z Centrum Badań Informatyki Biomedycznej (BMIR) w Stanfordzie w Stanach Zjednoczonych, znanego z rozwoju usług opartych na ontologii. Naukowcy stworzyli publicznie dostępną usługę internetową SIFR Annotator, która umożliwia przetwarzanie biomedycznych danych tekstowych w języku francuskim. SIFR Annotator oznacza nieprzetworzony tekst za pomocą odpowiednich koncepcji ontologii biomedycznej i semantycznie rozszerza adnotacje, wykorzystując wiedzę zawartą w ontologiach. Na przykład: jeśli notatka kliniczna zawiera frazę „brak objawów czerniaka”, adnotacja semantyczna pomoże sklasyfikować pacjenta jako nieistotnego w badaniach nad rakiem. W ramach projektu stworzono również repozytorium ontologii SIFR BioPortal. Podobnie jak w przypadku technologii NCBO BioPortal opracowanej na Uniwersytecie Stanforda, na portalu SIFR BioPortal znajdują się różne terminologie i ontologie w języku francuskim, które umożliwiają społeczności dostęp do wielu usług związanych z ontologią.

Adnotacja danych klinicznych i jednostek agronomicznych

Dzięki współpracy z zespołem projektu PractiKPharma, SIFR Annotator został dopracowany i jest w stanie przetwarzać dane kliniczne oraz przyporządkowywać kontekst jednostkom chorobowym w notatkach klinicznych. Uczeni opracowali specjalne funkcje ułatwiające adnotację tekstu klinicznego, odpowiadające potrzebom Szpitala Europejskiego im. Georges’a Pompidou i Szpitala Uniwersyteckiego w Nancy. Ponadto zespół projektu SIFRm uogólnił metody naukowe w celu zbudowania otwartego repozytorium ontologii agronomicznych AgroPortal. Działanie to zostało zainicjowane przez środowisko naukowe Montpellier i ukończone dzięki wymianie naukowej z Uniwersytetem Stanforda. W oparciu o wyniki badań naukowych i doświadczenia z dziedziny biomedycyny naukowcy stworzyli AgroPortal, na którym dostępne są dane z dziedziny agronomii i dziedzin pokrewnych, takich jak żywność, nauki o roślinach i różnorodność biologiczna. „AgroPortal powstał z uwagi na potrzebę stworzenia wspólnej platformy służącej do hostingu, obsługi i dostosowywania zasobów semantycznych dostępnych w tej dziedzinie, umożliwiając ich wykorzystanie w zastosowaniach agroinformatycznych”, tłumaczy Jonquet. W repozytorium AgroPortalu znajduje się obecnie ponad 110 słowników i ontologii, które w najbliższej przyszłości będą ciągle wzbogacone. Na platformie zarejestrowało się już ponad 190 użytkowników, którzy regularnie ją odwiedzają. Badacze z zespołu projektu SIFRm opracowali pierwsze powszechnie dostępne narzędzie internetowe do rozpoznawania jednostek oraz wprowadzania adnotacji i kontekstu do francuskich tekstów biomedycznych. Serwis internetowy działa równie dobrze co inne platformy adnotacyjne i przewiduje się, że usprawni pracę wielu naukowców, w tym klinicystów, pracowników ochrony zdrowia i badaczy. W przyszłości, po zawiązaniu partnerstw ze szpitalami i ośrodkami badawczymi we Francji, wykorzystanie usługi SIFR Annotator w badaniach biomedycznych zwiększy się. W ramach podobnych działań narzędzie AgroPortal zostanie wykorzystane w projekcie www.d2kab.org (D2KAB), finansowanym głównie przez francuską Krajową Agencję Badawczą, który umożliwi przekształcenie danych z zakresu agronomii i różnorodności biologicznej w wiedzę.

Słowa kluczowe

SIFRm, biomedyczny, ontologia, adnotacja, AgroPortal, BioPortal, język francuski, dane kliniczne, indeksowanie

Znajdź inne artykuły w tej samej dziedzinie zastosowania