Interactive Machine Learning for Compositional Models of Natural Language

Projektinformationen

INTERACT

ID Finanzhilfevereinbarung: 853459

DOI

10.3030/853459

Projekt abgeschlossen

EK-Unterschriftsdatum 28 November 2019

Startdatum 1 März 2020

Enddatum 28 Februar 2026

Finanziert unter

EXCELLENT SCIENCE - European Research Council (ERC)

Gesamtkosten

€ 1 499 375,00

EU-Beitrag

€ 1 499 375,00

1 499 375,00

Koordiniert durch

UNIVERSITAT POLITECNICA DE CATALUNYA
Spain

Projektbeschreibung

Unterstützung von Computern beim Verständnis der menschlichen Sprache

Das Verständnis der natürlichen Sprache ist ein Zweig der künstlichen Intelligenz (KI), welcher mithilfe von Computersoftware Eingaben in Form von Sätzen im Text- oder Sprachformat versteht. Stellen Sie sich vor, Siri beantwortet eine Frage zur Verkehrslage heute Morgen oder Alexa wird nach dem Wetter in Ihrer Stadt gefragt. Mit anderen Worten, die Technologie für das Verständnis der natürlichen Sprache verarbeitet einen menschlichen Text, übersetzt ihn in Computersprache und erzeugt eine Ausgabe in menschlicher Sprache. Anwendungen, die auf dem Verständnis der natürlichen Sprache beruhen, haben einen einzigartigen Informationsbedarf und erfordern große Sammlungen annotierter Daten, um gute Ergebnisse zu erzielen. Das EU-finanzierte Projekt INTERACT wird neue interaktive Lernalgorithmen entwickeln, die durch Anwendungen im Bereich Verständnis der natürlichen Sprache motiviert sind. Es wird Repräsentationenlernen und aktives Lernen von Compositional Latent-State-Models (CLSMs) zusammenführen, da die persönliche Sprache reich, komplex und kompositorisch ist.

Ziel

INTERACT will develop new Interactive Learning Algorithms (ILA), motivated by applications in Natural Language Understanding (NLU). The main assumptions behind supervised approaches are unrealistic because most NLU applications have unique information needs, and large collections of annotated data are necessary to achieve good performance. INTERACT follows a collaborative machine learning paradigm that breaks the distinction between annotation and training. We focus on compositional latent-state models (CLSMs) because natural language is rich, complex and compositional. To reduce the amount of human feedback necessary for learning CLSMs we must eliminate annotation redundancy. We argue that to achieve this in the context of CLSMs we must combine: (1) An optimal human feedback strategy, with (2) inducing a latent structure of parts in the compositional domain. Annotation effort will be minimized because the method will only request representative feedback from each latent class. INTERACT marries representation learning (i.e. of parts) and active learning for CLSMs.

Our approach goes beyond classical active learning where the ILA asks labels for samples chosen from a pool of unlabeled data. We empower the ILA with the ability to ask for labels for any complete or partial structure in the domain, i.e. the ILA will be able to generate samples.

We work under the framework of spectral learning of weighted automata and grammars and use ideas from query learning. A key idea is reducing the problem of interactive learning of CLSMs to a form of interactive low-rank matrix completion. Our concrete goals are: (1) Develop ILAs for CLSMs based on spectral learning techniques; and (2) Investigate optimal strategies to leverage human feedback, taking into account what is optimal for the ILA and what is easy for the teacher.

We will experiment with NLU tasks of increasing complexity, from sequence and tree classification to parsing problems where the outputs are trees.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Sozialwissenschaften Bildungswissenschaften Didaktik

Schlüsselbegriffe

Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

H2020-EU.1.1. - EXCELLENT SCIENCE - European Research Council (ERC) HAUPTPROGRAMM
Alle im Rahmen dieses Programms finanzierten Projekte anzeigen

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

ERC-2019-STG - ERC Starting Grant
Alle im Rahmen dieses Themas finanzierten Projekte anzeigen

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

ERC-STG - Starting Grant

Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

(öffnet in neuem Fenster) ERC-2019-STG

Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigen

Gastgebende Einrichtung

UNIVERSITAT POLITECNICA DE CATALUNYA

Netto-EU-Beitrag

€ 1 499 375,00

Adresse

CALLE JORDI GIRONA 31
08034 BARCELONA
Spanien

Region

Este Cataluña Barcelona

Aktivitätstyp

Higher or Secondary Education Establishments

Links

Die Organisation kontaktieren

Website

Teilnahme an EU-FuI-Programmen

HORIZON-Kooperationsnetzwerk

Gesamtkosten

€ 1 499 375,00

Begünstigte (1)

UNIVERSITAT POLITECNICA DE CATALUNYA

Spanien

Netto-EU-Beitrag

€ 1 499 375,00

Projektbeschreibung

Unterstützung von Computern beim Verständnis der menschlichen Sprache

Ziel

Wissenschaftliches Gebiet (EuroSciVoc) CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Schlüsselbegriffe Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Aufforderung zur Vorschlagseinreichung Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

Gastgebende Einrichtung

Begünstigte (1)

Herunterladen Den Inhalt der Seite herunterladen

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Schlüsselbegriffe

Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.