European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Global Under-Resourced MEedia Translation

Article Category

Article available in the following languages:

Projekt programu „Horyzont 2020” umożliwia przeprowadzenie największego eksperymentu dotyczącego tłumaczenia maszynowego w globalnych serwisach informacyjnych

W odpowiedzi na zapotrzebowanie światowych mediów na szybkie i dokładne tłumaczenia w językach, dla których dostępne są ograniczone zasoby danych, w ramach projektu finansowanego przez UE przesunięto granice badań i rozwiązań stosowanych w newsroomach.

Gospodarka cyfrowa icon Gospodarka cyfrowa

Mimo że neuronowe tłumaczenia maszynowe stają się coraz bardziej zaawansowane, w przypadku wielu języków wyniki nie są jeszcze wystarczająco wiarygodne, aby można je było zastosować w redakcjach informacyjnych, w których najważniejsza jest dokładność. Zespół finansowanego przez UE projektu GoURMET postawił sobie za cel zwiększenie potencjału neuronalnego tłumaczenia maszynowego dla par językowych i dziedzin o ograniczonych zasobach. Zespół GoURMET skupił się na monitorowaniu mediów, tworzeniu treści i ulepszaniu dziedzin dla treści dotyczących zdrowia w 16 parach języków o niewielkich zasobach. Języki te mają dla dwóch nadawców medialnych potencjalną tygodniową widownię wynoszącą ponad 120 milionów osób. Oznacza to, że projekt jest największym międzynarodowym eksperymentem w zakresie tłumaczenia maszynowego, przeprowadzonym przez globalnych nadawców serwisów informacyjnych. Trzy wiodące europejskie uczelnie zajmujące się tą dziedziną (Uniwersytety w Alicante, Amsterdamie i Edynburgu jako koordynatorzy) ściśle współpracowały z zespołami ds. innowacji w British Broadcasting Corporation (BBC) i Deutsche Welle (DW) w celu zidentyfikowania interesujących je języków, skompilowania danych szkoleniowych i testowych z ich portfolio treści oraz poddania wyników ocenie przez rodzimych dziennikarzy. Podczas zaplanowanego na 42 miesiące projektu wystąpiły jednak nieprzewidziane trudności. „W ostatnich latach mieliśmy niezwykły natłok złych wiadomości, od pandemii COVID przez przewrót w Mjanmie po inwazję na Ukrainę”, mówi koordynatorka projektu Alexandra Birch. „Trudno było zaangażować dziennikarzy i specjalistów językowych, gdyż mieli oni na głowie bardzo dużo obowiązków w związku z zawirowaniami, jakie COVID-19 wywołał w codziennych procesach związanych z produkcją”. „Ale nie tylko media były pod presją. W fazie projektu, w której opracowywaliśmy modele tłumaczenia dla języka birmańskiego, współpracujący z nami badacze i naukowcy z Mjanmy przestali być dostępni, ponieważ stanęli na czele protestów przeciwko wojskowej dyktaturze”, opowiada Birch.

Ulepszanie treści i danych w językach, dla których dostępne są niewystarczające zasoby

Gdy rozpoczynano projekt GoURMET, w pracach nad tłumaczeniem maszynowym o niewielkich zasobach publikowano wyniki dotyczące języków europejskich o mniejszych zasobach, takich jak rumuński czy fiński, lub niewielkich ilości par języków o dużych zasobach, takich jak niemiecki. „W dziedzinie nastąpił ogromny postęp, a my mamy w tym pewien udział”, zauważa Birch. Naukowcy przeprowadzili trzy wspólne zadania na językach o niewielkich zasobach: gudźarati, tamilskim i hausa, w których udział wzięli zarówno przedstawiciele branży, jak i środowiska akademickiego. Opublikowali ponad 80 publikacji i stworzyli ulepszone sposoby zbierania danych, same dane i modele, które są ogólnie dostępne.

Przygotowywanie gruntu pod tłumaczenia maszynowe w newsroomach

Modele GoURMET odznaczają się wysoką jakością, mają formę otwartoźródłową, są łatwo dostępne, możliwe do zainstalowania lokalnie i tanie, a zatem konkurencyjne w stosunku do systemów komercyjnych, które również są zintegrowane. Model opracowany w projekcie GoURMET w celu badania i eksperymentowania z prawdziwymi przypadkami użycia dotyczącymi mediów pomógł BBC News Labs w opracowaniu wielojęzycznego zestawu narzędzi dziennikarskich. W jego skład wchodzi platforma monitorująca do śledzenia rozwoju wydarzeń w dowolnym języku, która okazała się szczególnie skuteczna podczas kluczowych wydarzeń globalnych, takich jak wojna w Ukrainie, narzędzie do odkrywania służące do znajdowania i tłumaczenia najlepszych oryginalnych utworów oraz półautonomiczny generator grafik wykorzystujący modele tłumaczenia maszynowego. W uznaniu dla tych prac News Labs trafił na skróconą listę kandydatów do nagrody BBC News Innovation Award oraz do Computing Technology Product Award. DW z powodzeniem wprowadziło tłumaczenie maszynowe do usługi transkrypcji, tłumaczenia, napisów i podkładania głosu o nazwie „plain X”, która wkrótce zostanie udostępniona dziennikarzom.

Słowa kluczowe

GoURMET, tłumaczenie maszynowe, media, język o niewielkich zasobach, neuronowe tłumaczenie maszynowe

Znajdź inne artykuły w tej samej dziedzinie zastosowania