Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS
Zawartość zarchiwizowana w dniu 2024-06-18
Grammar-Based Robust Natural Language Processing

Article Category

Article available in the following languages:

W kierunku bardziej pojemnej teorii gramatycznej

Naukowcy korzystający ze środków unijnych starali się przywrócić teorii gramatycznej należne jej miejsce w teorii ludzkich zachowań językowych. W ramach projektu analizowano niedociągnięcia dotyczące problemu formalizmu w opartych na semantyce funkcjonalnych i kognitywnych teoriach gramatyki.

Obecne teorie psycholingwistyczne najczęściej nie odnoszą się do formalnej teorii językoznawstwa. Ponadto dominujące modele w lingwistyce komputerowej są na ogół niskopoziomowymi systemami stanu skończonego lub modelami pozbawionymi kontekstu, przez co nie odzwierciedlają pełnej złożoności języka ludzkiego. Celem projektu GRAMPLUS (Grammar-based robust natural language processing) było stworzenie bardziej ograniczonej teorii konstrukcji, wykorzystującej formalizm, który byłyby zarówno efektywny analizowalny, jak i wystarczająco ekspresyjny, by umożliwić interpretację semantyczną. Zespół starał się rozszerzyć teorię językoznawstwa i jej dotychczasowe zastosowania komputerowe w kilku różnych kierunkach teoretycznych, obliczeniowych i stosowanych, wykorzystując do tego kombinatoryczną gramatykę kategorialną (CCG). Choć CCG jest powszechnie wykorzystywana w zastosowaniach obliczeniowych, analizatory składniowe oparte na CCG mają ograniczone możliwości działania ze względu na wąskie gardło dotyczące znaczonych danych. Uczestnicy projektu GRAMPLUS zaproponowali zatem szereg rozszerzeń samej CCG, jak i powiązanych z nią rozwiązań obliczeniowych. Podejście to pozwoliło na wprowadzenie szeregu ważnych udoskonaleń, na przykład uogólnienia analizatora składniowego wykorzystującego kilka częściowo nadzorowanych metod trenowanych na nieoznaczonym tekście. Zespół opracował też nowe techniki analizy składniowej oraz automatycznej indukcji składniowej na podstawie zdań dobranych w pary przy pomocy zapytań z bazy danych. To ostatnie rozwiązanie zostało z powodzeniem zastosowane w psychologicznym i językoznawczym modelu uczenia się języka przez dzieci, bazującym na wystawieniu na kontekst ujawniający znaczenie. Stworzono także udoskonalone analizatory składniowe dla języków o ograniczonych zasobach, w tym hindi, oraz połączono semantykę logiczną i dystrybucyjną z doskonałą skutecznością aplikacji odpowiadającej na pytania. Innym osiągnięciem było wykazanie, że możliwe jest analizowanie harmonii muzycznej przy pomocy tego samego rodzaju gramatyki CCG, z użyciem tego samego algorytmu analizy składniowej i modelu statystycznego. Rezultaty omawianego projektu mają implikacje dla uczenia maszynowego oraz zadań wymagających interpretacji semantycznej. Opracowane w ramach projektu GRAMPLUS metody oraz wyniki przeprowadzonych badań powinny też zainteresować językoznawców, psychologów i uczonych zajmujących się naukami poznawczymi, jak również specjalistów zajmujących się praktycznymi zastosowaniami przetwarzania języka naturalnego.