CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Heterogeneous Learning for Natural Language Processing

Article Category

Article available in the following languages:

Realistyczny interfejs głosowy

Wysiłki badaczy z UE przyczyniły się do lepszego rozpoznawania mowy ludzkiej przez komputery. Przeprowadzone prace polegały na prezentowaniu komputerom dużych ilości materiałów źródłowych o wstępnie określonym formacie przy użyciu nowych algorytmów umożliwiających automatyczne nadawanie struktury.

Gospodarka cyfrowa icon Gospodarka cyfrowa

Komputery nadal mają bardzo ograniczone możliwości interpretowania ludzkiego języka naturalnego. Wynika to między innymi z faktu, że główna metoda uczenia komputerów, czyli nanoszenie adnotacji eksperckich, jest powolna, kosztowna i mało elastyczna. Za cel finansowanego ze środków UE projektu HELENLP (Heterogeneous learning for natural language processing) przyjęto tworzenie systemów zdolnych do lepszej interakcji z ludźmi. Prace projektu skoncentrowano na poprawianiu wydajności poprzez dodanie ogromnego zestawu nowych źródeł cyfrowych o różnych stopniach adnotacji. Komputery korzystające z planowanych algorytmów mogłyby automatycznie interpretować źródła, odpytując moduł adnotacji. Badacze zamierzali opracować dodatkowe algorytmy adnotacji, dążąc ostatecznie do poprawy rozumienia mowy i tekstu przez komputery. Prace skoncentrowano na nowych metodach obliczeniowych i statystycznych integrowania i analizowania źródeł cyfrowych. Opracowano pasywne metody opisywania danych już częściowo opatrzonych adnotacjami bez użycia modułu adnotacji oraz metody aktywne, korzystające z takiego modułu. W nowych algorytmach uwzględniono też uczenie równoczesne poprzez łączenie kilku źródeł danych opatrzonych adnotacjami. Potencjalne zastosowania to kategoryzacja tekstu oraz segmentacja i rozpoznawanie fonemów. Projekt osiągnął cel zintegrowania silnej grupy badawczej. Prace zaowocowały stworzeniem puli badaczy, pozyskaniem dodatkowych funduszy i publikacjami badawczymi. Nowe algorytmy z projektu HELENLP mogą usprawnić przetwarzanie ludzkiego języka naturalnego przez komputery.

Słowa kluczowe

Komputer, mowa ludzka, komunikacja ludzka, adnotacja, przetwarzanie języka naturalnego

Znajdź inne artykuły w tej samej dziedzinie zastosowania