Opis projektu
Neuronowo-symboliczne podejścia w zakresie systemów NLG
Programowanie sztucznej inteligencji może być wykorzystywane do tworzenia tekstu na podstawie danych. Jest to tzw. generowanie języka naturalnego (NLG), które polega na przekształcaniu złożonych danych w naturalnie brzmiący język – tak, jakby był napisany przez człowieka. Zespół finansowanego ze środków UE projektu NG-NLG będzie badał neuronowe podejścia do NLG, które wciąż ograniczają się do zastosowań eksperymentalnych. Wynika to z faktu, że pomimo iż dane generowane przez najnowsze systemy neuronowe wyglądają bardzo naturalnie, zachowanie neuronowych systemów NLG nie jest przejrzyste ani wiarygodne. W ramach projektu opracowane zostaną innowacyjne podejścia, które łączą podejścia neuronowe z jawnymi symbolicznymi reprezentacjami semantycznymi, dzięki czemu umożliwią większą kontrolę nad danymi wyjściowymi i jawne wnioskowanie logiczne w odniesieniu do danych. Zespół przetestuje opracowane przez siebie podejścia do generowania danych do tekstu, podsumowania i generowania odpowiedzi dialogowych.
Cel
This project aims to overcome the major hurdles that prevent current state-of-the-art models for natural language generation (NLG) from real-world deployment.
While deep learning and neural networks brought considerable progress in many areas of natural language processing, neural approaches to NLG remain confined to experimental use and production NLG systems are handcrafted. The reason for this is that despite the very natural and fluent outputs of recent neural systems, neural NLG still has major drawbacks: (1) the behavior of the systems is not transparent and hard to control (the internal representation is implicit), which leads to incorrect or even harmful outputs, (2) the models require a lot of training data and processing power do not generalize well, and are mostly English-only. On the other hand, handcrafted models are safe, transparent and fast, but produce less fluent outputs and are expensive to adapt to new languages and domains (topics). As a result, usefulness of NLG models in general is limited. In addition, current methods for automatic evaluation of NLG outputs are unreliable, hampering system development.
The main aims of this project, directly addressing the above drawbacks, are:
1) Develop new approaches for NLG that combine neural approaches with explicit symbolic semantic representations, thus allowing greater control over the outputs and explicit logical inferences over the data.
2) Introduce approaches to model compression and adaptation to make models easily portable across domains and languages.
3) Develop reliable neural-symbolic approaches for evaluation of NLG systems.
We will test our approaches on multiple NLG applications—data-to-text generation (e.g. weather or sports reports), summarization, and dialogue response generation. For example, our approach will make it possible to deploy a new data reporting system for a given domain based on a few dozen example input-output pairs, compared to thousands needed by current methods.
Dziedzina nauki
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
Słowa kluczowe
Program(-y)
- HORIZON.1.1 - European Research Council (ERC) Main Programme
Temat(-y)
System finansowania
HORIZON-ERC - HORIZON ERC GrantsInstytucja przyjmująca
116 36 Praha 1
Czechy