Opis projektu
Bardziej precyzyjne neuronalne tłumaczenie maszynowe dla języków o ograniczonych zasobach
W świecie, w którym dostęp do precyzyjnych i aktualnych informacji stał się koniecznością, dziennikarze stale potrzebują odpowiednich narzędzi do szybkiego i dokładnego tłumaczenia w przypadku języków o bardzo ograniczonych zasobach. Pomimo szybkiego rozwoju neuronalne tłumaczenie maszynowe nie jest jeszcze w stanie dostarczyć wysokiej jakości tłumaczeń w większości par językowych ze względu na brak danych i paralelnych korpusów językowych. Zespół finansowanego przez UE projektu GoURMET chce poprawić skuteczność i praktyczność neuronalnego tłumaczenia maszynowego dla par językowych i dziedzin o ograniczonych zasobach. Naukowcy skupią się na tworzeniu treści globalnych, których tłumaczenia maszynowe będą poprawiane przez rodzimych użytkowników danego języka, oraz na monitorowaniu międzynarodowych mediów informacyjnych dla par językowych o ograniczonych zasobach.
Cel
Machine translation (MT) is an increasingly important technology for supporting communication in a globalised world. MT technology has gradually increased over the last ten years, but recent advances in neural machine translation (NMT), have resulted in significant interest in industry and have lead to very rapid adoption of the new paradigm (eg. Google, Facebook, UN, World International Patent Office). Although these models have shown significant advances in state-of-the-art performance they are data intensive and require parallel corpora of many millions of human translated sentences for training. Neural Machine translation is currently not able to deliver usable translations for the vast majority of language pairs in the world. This is especially problematic for our user partners, the BBC and DW who need access to fast and accurate translation for languages with very few resources.
The aim of GoURMET is to significantly improve the robustness and applicability of neural machine translation for low-resource language pairs and domains.
GoURMET has five objectives:
- Development of a high-quality machine translation for under-resourced language pairs and domains;
- Adaptable to new and emerging languages and domains;
- Development of tools for analysts and journalists;
- Sustainable, maintainable platform and services;
- Dissemination and communication of project results to stakeholders and user group.
The project will focus on two use cases:
- Global content creation - managing content creation in several languages efficiently by providing machine translations for correction by humans;
- Media monitoring for low resource language pairs - tools to address the challenge of international news monitoring problem.
The outputs of the project will be field-tested at partners BBC and DW, and the platform will be further validated through innovation intensives such as the BBC NewsHack.
Dziedzina nauki
Słowa kluczowe
Program(-y)
Zaproszenie do składania wniosków
Zobacz inne projekty w ramach tego zaproszeniaSzczegółowe działanie
H2020-ICT-2018-2
System finansowania
RIA - Research and Innovation actionKoordynator
EH8 9YL Edinburgh
Zjednoczone Królestwo