Bardziej zrozumiałe tłumaczenia wyrażeń
Wyrażenia w konkretnym języku zwykle trudno jest przetłumaczyć, przez co stanowią one poważne wyzwanie dla tłumaczy ustnych i pisemnych w coraz bardziej zglobalizowanym świecie. W ramach finansowanego ze środków UE projektu LATEST (Advanced language technology platform for translators (LATEST)) opracowano nową metodę automatycznego identyfikowania i tłumaczenia wyrażeń wielowyrazowych (kolokacji). Partnerzy projektu potraktowali tłumaczenie wyrażeń wielowyrazowych jako proces dwuetapowy. Pierwszy etap polega na wyodrębnianiu wyrażeń wielowyrazowych w analizowanym języku, a drugi na uruchomieniu odpowiedniej dla danego języka procedury dopasowywania w celu zaproponowania odpowiedników w tłumaczeniu. W zastosowanym podejściu nie są używane tradycyjne zasoby tłumaczeniowe, na przykład słowniki, gdyż ich przetwarzanie jest zbyt czasochłonne. Zamiast nich używane są porównywalne korpusy językowe zebrane w opłacalny sposób. Partnerzy projektu LATEST przetestowali tę metodę na danych z języka angielskiego i hiszpańskiego, koncentrując się na wyrażeniach czasownik-rzeczownik. W procesie wyodrębniania zastosowano statystyczne miary skojarzenia w celu szacowania stopnia powiązania określonych par słów i proponowania odpowiednich kombinacji w przekładzie. Na etapie tłumaczenia stosowane były następnie metody określania podobieństw rozkładu bazujące na założeniu, że analizowane wyrażenie występuje w identycznych lub podobnych kontekstach jak jego odpowiednik w tłumaczeniu. Teksty testowe do tłumaczenia zebrano z artykułów prasowych, zgodnie z planowaną metodą pozyskiwania materiałów dla innych kombinacji językowych po zakończeniu projektu. W kwestii jakości i rozmiaru korpusów tekstowych używanych do porównań stwierdzono, że dla dokładnego tłumaczenia automatycznego jakość danych jest ważniejsza od ich ilości. Wyniki projektu wskazały nowe kierunki badań w dziedzinie frazeologii, a konkretnie frazeologii obliczeniowej. Wyniki zaprezentowano specjalistom na konferencjach i poprzez publikacje, otwierając nowe obszary dyskusji w zakresie tłumaczeń automatycznych i wspomagając ulepszanie tej ważnej technologii. W obliczu coraz bliższych kontaktów między krajami w Europie i na świecie opracowanie metod szybszego i bardziej naturalnego tłumaczenia automatycznego będzie niewątpliwie osiągnięciem korzystnym.
Słowa kluczowe
Automatyczne tłumaczenie, tłumaczenia, technologie językowe, wyrażenia wielowyrazowe, frazeologia