Wspólnotowy Serwis Informacyjny Badan i Rozwoju - CORDIS

FP7

ODASP Wynik w skrócie

Project ID: 331196
Źródło dofinansowania: FP7-PEOPLE
Kraj: Włochy

Rozwiązanie problemu polisemii

Naukowcy z UE opracowali metodę pozwalającą na ontologiczne przedstawienie powiązania wyrazów z wieloma ich znaczeniami. Uczeni zidentyfikowali odpowiednie wpisy w jednej z językowych baz danych oraz zaproponowali rozwiązania problemów językoznawczych w zakresie przeszukiwania baz danych.
Rozwiązanie problemu polisemii
Polisemia to zjawisko polegające na tym, że jedno słowo lub wyrażenie ma więcej niż jedno znaczenie. W większości form systematycznych zjawisko to jest odbiciem głęboko zakorzenionych zasad pojęciowych, w oparciu o które porządkujemy naszą wiedzę o świecie. Jednakże, mimo że ludzie z łatwością przetwarzają takie zależności pojęciowe, są one źródłem dużych trudności przy opracowywaniu systemów zarządzających informacjami kodowanymi językowo.

Uczestnicy projektu ODASP (Ontology driven analysis of nominal systematic polysemy in WordNet), finansowanego ze środków UE, postanowili udoskonalić metody standardowej reprezentacji informacji o świecie i ich porządkowania w informatyce, na przykład w ontologiach obliczeniowych. Prace koncentrowały się głównie na ontologiach zbudowanych z kategorii i zależności językowych. Konsorcjum zajęło się trudnościami związanymi z przedstawieniem zależności pojęciowych będących podstawą systematycznej polisemii w jednym z dużych internetowych korpusów języka angielskiego, WordNet. Uczeni przeanalizowali problem wielokrotnego dziedziczenia, będący jedną z głównych przyczyn "błędu przeciążenia IS A". Zastosowane w projekcie metodologie oparto na ontologii filozoficznej i językoznawstwie.

Zespół określił odsetek wpisów w bazie WordNet, których dotyczy ten problem. Zaproponowano rozwiązania wykorzystujące nowy rodzaj zależności semantycznej dostępnej w WordNet: zależność strukturalną (ang. "constitution relation"). Rozwiązanie polega na wzbogaceniu struktury WordNet w taki sposób, aby odpowiednio przedstawiała złożone pojęcia, w wyniku czego powstaje osobna hierarchia językowa wyrastająca ze standardowych prostych pojęć.

Uczeni stworzyli formalną reprezentację teoretyczną tej zależności w obrębie ontologii wysokiego poziomu. Nałożenie jej na przebudowany górny poziom korpusu WordNet pozwala na wyciąganie nowych wniosków semantycznych. Zaproponowana ontologia jest pozbawiona ograniczeń wcześniejszych rozwiązań dzięki zastosowaniu podejścia odgórnego, opartego na dokładnej analizie ograniczeń ontologicznych i zależności tworzących polisemię.

Przeprowadzone badania pozwoliły na określenie problemu dotyczącego definiowania kategorii pojęć, związanego ze zjawiskiem leksykalnym określanym jako "inherentna polisemia nominalna". W ten sposób dowiedziono znaczenia rezultatów projektu dla ontologii w wymiarze ogólnym.

Owocem projektu jest też wymiana wiedzy. Na poziomie uniwersyteckim objęła ona szkolenie dla jednego studenta MS w zakresie metod z tej dziedziny. Na poziomie europejskim i międzynarodowym wymiana wiedzy polegała przede wszystkim na współpracy badawczej.

Opracowane w ramach projektu ODASP zasady podziału na kategorie mogą znaleźć zastosowanie nie tylko w odniesieniu do językowego zjawiska polisemii, ale także do innych systemów ontologicznych, przyczyniając się do poprawy ich efektywności, na przykład w bazach danych biomedycznych.

Powiązane informacje

Słowa kluczowe

Polisemia, analiza, WordNet, konstrukcja, relacja
Numer rekordu: 182706 / Ostatnia aktualizacja: 2016-05-18
Dziedzina: Technologie przemysłowe