Workflows for the Large-Scale Collection and Transference of Knowledge across Languages: Using Natural Language Processing to Produce High-Quality Contents with Language Learners

Informacje na temat projektu

WIKOLLECT

Identyfikator umowy o grant: 845320

DOI

10.3030/845320

Realizacja projektu zakończyła się 23 Lipca 2020

Data podpisania przez KE 23 Kwietnia 2019

Data rozpoczęcia 1 Września 2020

Data zakończenia 31 Sierpnia 2022

Finansowanie w ramach

EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions

Koszt całkowity

€ 183 473,28

Wkład UE

€ 183 473,28

183 473,28

Koordynowany przez

ACCADEMIA EUROPEA DI BOLZANO
Italy

Opis projektu

Nowy proces transferu wiedzy pomiędzy językami

Tłumaczenie to złożony proces przekładu tekstu z jednego języka na drugi. Podczas tłumaczenia trudno jest odwzorować tekst źródłowy „słowo w słowo” w tekście docelowym ze względu na to, że każdy język to odrębny system z własnymi regułami. Problematyką tłumaczeń zajmie się zespół finansowanego przez UE projektu WIKOLLECT, łącząc technologie przetwarzania języka naturalnego z nauką języków i wiedzą społecznościową. W ramach projektu powstanie specjalny proces transferu znacznych ilości wiedzy o wysokiej jakości pomiędzy językami, obejmujący cztery etapy: od automatycznego rozpoznawania treści w języku źródłowym, których brakuje w tekście docelowym, aż po generowanie tłumaczeń. Podczas realizacji projektu zespół przetestuje swój proces podczas tłumaczenia serwisu Wiktionary – ogólnodostępnego wielojęzycznego słownika internetowego – na język włoski i niemiecki. Ogólnym celem projektu jest promowanie sprawiedliwego korzystania z treści w różnych językach oraz ułatwianie transferu wiedzy.

Cel

WiKollect aims at creating a workflow for the large-scale transference of high-quality contents across languages. The workflow is divided in four cyclic steps. In step (i) an automatic model will identify contents available in a document in language A which are missing in a document, on the same topic, in language B. In step (ii) candidates to fill the gaps in the document in language B will be automatically generated. In step (iii) such candidates will be subject to manual evaluation by language learners. In step (iv) the contents identified as high-quality will be promoted to fill the gaps in the document in language B. WiKollect will take advantage of the barely-exploited synergy among natural language processing, language learning, and crowdsourcing. To address the different research challenges posed by the workflow design and implementation, it will create an innovative and re-usable hybrid intelligence architecture combining (a) artificial intelligence —such as machine learning and natural language processing— to identify contents worth transferring across languages and generate potential translations and (b) human intelligence —by means of implicit crowdsourcing— relying on a crowd of language learners to flag good contents. WiKollect will create different by-products in addition to the research products that will be generated by addressing each step in the four-step workflow. Language learning exercises on specific topics and complexity levels will be generated. The fair re-use of contents across languages will be promoted with the mass production of high-quality contents. During the MSC period, WiKollect will target the generation of Wiktionary contents in Italian and German. Still, the workflow is flexible and extendable and can be applied to other documents (e.g. Wikipedia articles, news) and languages in the near future.

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

H2020-EU.1.3. - EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions GŁÓWNY PROGRAM
Wyświetl wszystkie projekty finansowane w ramach tego programu
H2020-EU.1.3.2. - Nurturing excellence by means of cross-border and cross-sector mobility
Wyświetl wszystkie projekty finansowane w ramach tego programu

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

MSCA-IF-2018 - Individual Fellowships
Wyświetl wszystkie projekty finansowane w ramach tego zagadnienia

System finansowania

Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.

MSCA-IF - Marie Skłodowska-Curie Individual Fellowships (IF)

Wyświetl wszystkie projekty finansowane w ramach tego programu finansowania

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

(odnośnik otworzy się w nowym oknie) H2020-MSCA-IF-2018

Wyświetl wszystkie projekty finansowane w ramach tego zaproszenia

Koordynator

ACCADEMIA EUROPEA DI BOLZANO

Wkład UE netto

€ 183 473,28

Adres

VIALE DRUSO 1
39100 BOLZANO
Włochy

Region

Nord-Est Provincia Autonoma di Bolzano/Bozen Bolzano-Bozen

Rodzaj działalności

Research Organisations

Linki

Kontakt z organizacją

Strona internetowa

Uczestnictwo w unijnych programach w zakresie badań i innowacji

sieć współpracy HORIZON

Koszt całkowity

€ 183 473,28

Opis projektu

Nowy proces transferu wiedzy pomiędzy językami

Cel

Program(-y) Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y) Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

Koordynator

Pobierz Pobierz zawartość strony

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.