Wspólnotowy Serwis Informacyjny Badan i Rozwoju - CORDIS

FP7

LATEST Wynik w skrócie

Project ID: 327197
Źródło dofinansowania: FP7-PEOPLE
Kraj: Hiszpania

Bardziej zrozumiałe tłumaczenia wyrażeń

Tłumaczenia wyrażeń na inne języki bywają dalekie od doskonałości. Nowa technika tłumaczeń automatycznych może pomóc w przezwyciężeniu tej trudności.
Bardziej zrozumiałe tłumaczenia wyrażeń
Wyrażenia w konkretnym języku zwykle trudno jest przetłumaczyć, przez co stanowią one poważne wyzwanie dla tłumaczy ustnych i pisemnych w coraz bardziej zglobalizowanym świecie. W ramach finansowanego ze środków UE projektu LATEST (Advanced language technology platform for translators (LATEST)) opracowano nową metodę automatycznego identyfikowania i tłumaczenia wyrażeń wielowyrazowych (kolokacji).

Partnerzy projektu potraktowali tłumaczenie wyrażeń wielowyrazowych jako proces dwuetapowy. Pierwszy etap polega na wyodrębnianiu wyrażeń wielowyrazowych w analizowanym języku, a drugi na uruchomieniu odpowiedniej dla danego języka procedury dopasowywania w celu zaproponowania odpowiedników w tłumaczeniu.

W zastosowanym podejściu nie są używane tradycyjne zasoby tłumaczeniowe, na przykład słowniki, gdyż ich przetwarzanie jest zbyt czasochłonne. Zamiast nich używane są porównywalne korpusy językowe zebrane w opłacalny sposób. Partnerzy projektu LATEST przetestowali tę metodę na danych z języka angielskiego i hiszpańskiego, koncentrując się na wyrażeniach czasownik-rzeczownik.

W procesie wyodrębniania zastosowano statystyczne miary skojarzenia w celu szacowania stopnia powiązania określonych par słów i proponowania odpowiednich kombinacji w przekładzie. Na etapie tłumaczenia stosowane były następnie metody określania podobieństw rozkładu bazujące na założeniu, że analizowane wyrażenie występuje w identycznych lub podobnych kontekstach jak jego odpowiednik w tłumaczeniu.

Teksty testowe do tłumaczenia zebrano z artykułów prasowych, zgodnie z planowaną metodą pozyskiwania materiałów dla innych kombinacji językowych po zakończeniu projektu. W kwestii jakości i rozmiaru korpusów tekstowych używanych do porównań stwierdzono, że dla dokładnego tłumaczenia automatycznego jakość danych jest ważniejsza od ich ilości.

Wyniki projektu wskazały nowe kierunki badań w dziedzinie frazeologii, a konkretnie frazeologii obliczeniowej. Wyniki zaprezentowano specjalistom na konferencjach i poprzez publikacje, otwierając nowe obszary dyskusji w zakresie tłumaczeń automatycznych i wspomagając ulepszanie tej ważnej technologii. W obliczu coraz bliższych kontaktów między krajami w Europie i na świecie opracowanie metod szybszego i bardziej naturalnego tłumaczenia automatycznego będzie niewątpliwie osiągnięciem korzystnym.

Powiązane informacje

Słowa kluczowe

Automatyczne tłumaczenie, tłumaczenia, technologie językowe, wyrażenia wielowyrazowe, frazeologia
Numer rekordu: 188764 / Ostatnia aktualizacja: 2016-11-03
Dziedzina: Technologie przemysłowe