Information Extraction for Everyone

Projektinformationen

iEXTRACT

ID Finanzhilfevereinbarung: 802774

DOI

10.3030/802774

Projekt abgeschlossen

EK-Unterschriftsdatum 30 April 2019

Startdatum 1 Mai 2019

Enddatum 30 April 2025

Finanziert unter

EXCELLENT SCIENCE - European Research Council (ERC)

Gesamtkosten

€ 1 499 354,00

EU-Beitrag

€ 1 499 354,00

1 499 354,00

Koordiniert durch

BAR ILAN UNIVERSITY
Israel

Projektbeschreibung

Computer lernen Dinge über die natürliche Sprache des Menschen

Computer sind ziemlich clever, doch sie haben Einschränkungen, insbesondere was die Verarbeitung natürlicher Sprache anbelangt. Die sprachliche Verarbeitung beinhaltet ein hohes Maß an abstrakten Regeln für die Informationsvermittlung, die es Computern erschweren, die menschlichen Sprachen zu entziffern und zu verstehen. Das EU-finanzierte Projekt iEXTRACT überprüft regelbasierte Methoden zur Informationsgewinnung mit Blick auf Fortschritte in der Verarbeitung natürlicher Sprache und im maschinellen Lernen. Die Informationsgewinnung ist ein gemeinschaftliches Vorhaben von Mensch und Computer, bei dem der Benutzer fachspezifisches Wissen angibt und das System verschiedene fachunabhängige linguistische Komplexitäten löst, sodass der Benutzer letztlich unstrukturierte Texte abfragen kann. Das oberste Ziel besteht darin, Fachleute wie z. B. Anwälte und Wissenschaftler zu unterstützen, indem sie zur Verarbeitung größerer Datenvolumen und zu beruflichen Fortschritten befähigt werden.

Ziel

Staggering amounts of information are stored in natural language documents, rendering them unavailable to data-science techniques. Information Extraction (IE), a subfield of Natural Language Processing (NLP), aims to automate the extraction of structured information from text, yielding datasets that can be queried, analyzed and combined to provide new insights and drive research forward.

Despite tremendous progress in NLP, IE systems remain mostly inaccessible to non-NLP-experts who can greatly benefit from them. This stems from the current methods for creating IE systems: the dominant machine-learning (ML) approach requires technical expertise and large amounts of annotated data, and does not provide the user control over the extraction process. The previously dominant rule-based approach unrealistically requires the user to anticipate and deal with the nuances of natural language.

I aim to remedy this situation by revisiting rule-based IE in light of advances in NLP and ML. The key idea is to cast IE as a collaborative human-computer effort, in which the user provides domain-specific knowledge, and the system is in charge of solving various domain-independent linguistic complexities, ultimately allowing the user to query
unstructured texts via easily structured forms.

More specifically, I aim develop:
(a) a novel structured representation that abstracts much of the complexity of natural language;
(b) algorithms that derive these representations from texts;
(c) an accessible rule language to query this representation;
(d) AI components that infer the user extraction intents, and based on them promote relevant examples and highlight extraction cases that require special attention.

The ultimate goal of this project is to democratize NLP and bring advanced IE capabilities directly to the hands of
domain-experts: doctors, lawyers, researchers and scientists, empowering them to process large volumes of data and
advance their profession.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Dieses Projekt wurde noch nicht bei EuroSciVoc klassifiziert.
Schlagen Sie die Wissenschaftsbereiche vor, die Ihrer Einschätzung nach besonders relevant sind, und helfen Sie uns, unseren Klassifizierungsdienst zu verbessern.

Schlüsselbegriffe

Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

H2020-EU.1.1. - EXCELLENT SCIENCE - European Research Council (ERC) HAUPTPROGRAMM
Alle im Rahmen dieses Programms finanzierten Projekte anzeigen

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

ERC-2018-STG - ERC Starting Grant
Alle im Rahmen dieses Themas finanzierten Projekte anzeigen

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

ERC-STG - Starting Grant

Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

(öffnet in neuem Fenster) ERC-2018-STG

Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigen

Gastgebende Einrichtung

BAR ILAN UNIVERSITY

Netto-EU-Beitrag

€ 1 499 354,00

Adresse

BAR ILAN UNIVERSITY CAMPUS
52900 Ramat Gan
Israel

Aktivitätstyp

Higher or Secondary Education Establishments

Links

Die Organisation kontaktieren

Website

Teilnahme an EU-FuI-Programmen

HORIZON-Kooperationsnetzwerk

Gesamtkosten

€ 1 499 354,00

Begünstigte (1)

BAR ILAN UNIVERSITY

Israel

Netto-EU-Beitrag

€ 1 499 354,00

Projektbeschreibung

Computer lernen Dinge über die natürliche Sprache des Menschen

Ziel

Wissenschaftliches Gebiet (EuroSciVoc) CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Schlüsselbegriffe Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Aufforderung zur Vorschlagseinreichung Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

Gastgebende Einrichtung

Begünstigte (1)

Herunterladen Den Inhalt der Seite herunterladen

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Schlüsselbegriffe

Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.