Information Extraction for Everyone

Informacje na temat projektu

iEXTRACT

Identyfikator umowy o grant: 802774

DOI

10.3030/802774

Projekt został zamknięty

Data podpisania przez KE 30 Kwietnia 2019

Data rozpoczęcia 1 Maja 2019

Data zakończenia 30 Kwietnia 2025

Finansowanie w ramach

EXCELLENT SCIENCE - European Research Council (ERC)

Koszt całkowity

€ 1 499 354,00

Wkład UE

€ 1 499 354,00

1 499 354,00

Koordynowany przez

BAR ILAN UNIVERSITY
Israel

Opis projektu

Komputery uczą się naturalnego języka człowieka

Komputery są dość inteligentne, ale mają swoje ograniczenia, szczególnie jeśli chodzi o przetwarzanie naturalnego języka. Przetwarzanie języka obejmuje bowiem abstrakcyjne i skomplikowane reguły przekazywania informacji, co utrudnia komputerowi rozszyfrowanie i zrozumienie ludzkich języków. Autorzy współfinansowanego ze środków UE projektu iEXTRACT dokonają przeglądu metod pozyskiwania informacji opartych na regułach w świetle postępów w przetwarzaniu języka naturalnego i uczeniu maszynowym. Wyłapywanie informacji to wspólny wysiłek człowieka i komputera, w ramach którego użytkownik zapewnia wiedzę specyficzną dla danej dziedziny, a system rozwiązuje niezależne od tej dziedziny złożoności językowe, ostatecznie pozwalając użytkownikowi wyszukiwać nieustrukturyzowane teksty. Głównym celem projektu jest pomoc ekspertom w danej dziedzinie, na przykład prawnikom i naukowcom, poprzez umożliwienie im przetwarzania dużych ilości danych i rozwoju ich profesji.

Cel

Staggering amounts of information are stored in natural language documents, rendering them unavailable to data-science techniques. Information Extraction (IE), a subfield of Natural Language Processing (NLP), aims to automate the extraction of structured information from text, yielding datasets that can be queried, analyzed and combined to provide new insights and drive research forward.

Despite tremendous progress in NLP, IE systems remain mostly inaccessible to non-NLP-experts who can greatly benefit from them. This stems from the current methods for creating IE systems: the dominant machine-learning (ML) approach requires technical expertise and large amounts of annotated data, and does not provide the user control over the extraction process. The previously dominant rule-based approach unrealistically requires the user to anticipate and deal with the nuances of natural language.

I aim to remedy this situation by revisiting rule-based IE in light of advances in NLP and ML. The key idea is to cast IE as a collaborative human-computer effort, in which the user provides domain-specific knowledge, and the system is in charge of solving various domain-independent linguistic complexities, ultimately allowing the user to query
unstructured texts via easily structured forms.

More specifically, I aim develop:
(a) a novel structured representation that abstracts much of the complexity of natural language;
(b) algorithms that derive these representations from texts;
(c) an accessible rule language to query this representation;
(d) AI components that infer the user extraction intents, and based on them promote relevant examples and highlight extraction cases that require special attention.

The ultimate goal of this project is to democratize NLP and bring advanced IE capabilities directly to the hands of
domain-experts: doctors, lawyers, researchers and scientists, empowering them to process large volumes of data and
advance their profession.

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.

Projekt nie został jeszcze sklasyfikowany według klasyfikacji EuroSciVoc.
Wskaż dziedziny nauki, które twoim zdaniem są najbardziej istotne z punktu widzenia tego projektu i pomóż nam usprawnić naszą usługę klasyfikacji.

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

H2020-EU.1.1. - EXCELLENT SCIENCE - European Research Council (ERC) GŁÓWNY PROGRAM
Wyświetl wszystkie projekty finansowane w ramach tego programu

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

ERC-2018-STG - ERC Starting Grant
Wyświetl wszystkie projekty finansowane w ramach tego zagadnienia

System finansowania

Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.

ERC-STG - Starting Grant

Wyświetl wszystkie projekty finansowane w ramach tego programu finansowania

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

(odnośnik otworzy się w nowym oknie) ERC-2018-STG

Wyświetl wszystkie projekty finansowane w ramach tego zaproszenia

Instytucja przyjmująca

BAR ILAN UNIVERSITY

Wkład UE netto

€ 1 499 354,00

Adres

BAR ILAN UNIVERSITY CAMPUS
52900 Ramat Gan
Izrael

Rodzaj działalności

Higher or Secondary Education Establishments

Linki

Kontakt z organizacją

Strona internetowa

Uczestnictwo w unijnych programach w zakresie badań i innowacji

sieć współpracy HORIZON

Koszt całkowity

€ 1 499 354,00

Beneficjenci (1)

BAR ILAN UNIVERSITY

Izrael

Wkład UE netto

€ 1 499 354,00

Opis projektu

Komputery uczą się naturalnego języka człowieka

Cel

Słowa kluczowe Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y) Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y) Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

Instytucja przyjmująca

Beneficjenci (1)

Pobierz Pobierz zawartość strony

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.