Descrizione del progetto
Modellizzazione dinamica di sistemi di dialogo orientati alle mansioni
I sistemi di dialogo parlato registrano un’impennata in termini di popolarità e accettazione dovuta all’aumento degli assistenti personali. I sistemi di dialogo attualmente impiegati in contesti accademici e industriali sono generalmente costruiti per una gamma fissa di funzioni e non consentono un’espansione semplice di nuovi argomenti. Tuttavia, in linea con la continua evoluzione globale e l’espansione delle conoscenze, un sistema realmente intelligente deve essere dinamico, nonché in grado di comprendere e formulare ininterrottamente ragionamenti su nuovi argomenti. Il progetto DYMO, finanziato dall’UE, si propone di affrontare gli ostacoli più sostanziali lungo il percorso verso sistemi di conversazione intelligenti che possano espandersi in modo dinamico, spaziando dal problema di operare con conoscenze dinamiche, linee guida dinamiche e ricchi modelli utenti fino alle sofisticate misurazioni della qualità.
Obiettivo
With the prevalence of information technology in our daily lives, our ability to interact with machines in increasingly simplified and more human-like ways has become paramount. Information is becoming ever more abundant but our access to it is limited not least by technological restraints. Spoken dialogue systems address this issue by providing an intelligent speech interface that facilitates swift, human-like acquisition of information.
The advantages of speech interfaces are already evident from the rise of personal assistants such as Siri, Google Assistant, Cortana or Amazon Alexa. In these systems, however, the user is limited to a simple query, and the systems attempt to provide an answer within one or two turns of dialogue. To date, significant parts of these systems are rule-based and do not readily scale to changes in the domain of operation. Furthermore, rule-based systems can be brittle when speech recognition errors occur.
The vision of this project is to develop novel dialogue models that provide natural human-computer interaction beyond simple information-seeking dialogues and that continuously evolve as they are being used by exploiting both dialogue and non-dialogue data. Building such robust and intelligent spoken dialogue systems poses serious challenges in artificial intelligence and machine learning. The project will tackle four bottleneck areas that require fundamental research: automated knowledge acquisition, optimisation of complex behaviour, realistic user models and sentiment awareness. Taken together, the proposed solutions have the potential to transform the way we access information in areas as diverse as e-commerce, government, healthcare and education.
Campo scientifico
Parole chiave
Programma(i)
Argomento(i)
Meccanismo di finanziamento
ERC-STG - Starting GrantIstituzione ospitante
40225 Dusseldorf
Germania