Skip to main content
European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS
Zawartość zarchiwizowana w dniu 2024-05-28

Advanced LAnguage TEchnology Platform for TranSlaTors (LATEST)

Article Category

Article available in the following languages:

Bardziej zrozumiałe tłumaczenia wyrażeń

Tłumaczenia wyrażeń na inne języki bywają dalekie od doskonałości. Nowa technika tłumaczeń automatycznych może pomóc w przezwyciężeniu tej trudności.

Technologie przemysłowe icon Technologie przemysłowe

Wyrażenia w konkretnym języku zwykle trudno jest przetłumaczyć, przez co stanowią one poważne wyzwanie dla tłumaczy ustnych i pisemnych w coraz bardziej zglobalizowanym świecie. W ramach finansowanego ze środków UE projektu LATEST (Advanced language technology platform for translators (LATEST)) opracowano nową metodę automatycznego identyfikowania i tłumaczenia wyrażeń wielowyrazowych (kolokacji). Partnerzy projektu potraktowali tłumaczenie wyrażeń wielowyrazowych jako proces dwuetapowy. Pierwszy etap polega na wyodrębnianiu wyrażeń wielowyrazowych w analizowanym języku, a drugi na uruchomieniu odpowiedniej dla danego języka procedury dopasowywania w celu zaproponowania odpowiedników w tłumaczeniu. W zastosowanym podejściu nie są używane tradycyjne zasoby tłumaczeniowe, na przykład słowniki, gdyż ich przetwarzanie jest zbyt czasochłonne. Zamiast nich używane są porównywalne korpusy językowe zebrane w opłacalny sposób. Partnerzy projektu LATEST przetestowali tę metodę na danych z języka angielskiego i hiszpańskiego, koncentrując się na wyrażeniach czasownik-rzeczownik. W procesie wyodrębniania zastosowano statystyczne miary skojarzenia w celu szacowania stopnia powiązania określonych par słów i proponowania odpowiednich kombinacji w przekładzie. Na etapie tłumaczenia stosowane były następnie metody określania podobieństw rozkładu bazujące na założeniu, że analizowane wyrażenie występuje w identycznych lub podobnych kontekstach jak jego odpowiednik w tłumaczeniu. Teksty testowe do tłumaczenia zebrano z artykułów prasowych, zgodnie z planowaną metodą pozyskiwania materiałów dla innych kombinacji językowych po zakończeniu projektu. W kwestii jakości i rozmiaru korpusów tekstowych używanych do porównań stwierdzono, że dla dokładnego tłumaczenia automatycznego jakość danych jest ważniejsza od ich ilości. Wyniki projektu wskazały nowe kierunki badań w dziedzinie frazeologii, a konkretnie frazeologii obliczeniowej. Wyniki zaprezentowano specjalistom na konferencjach i poprzez publikacje, otwierając nowe obszary dyskusji w zakresie tłumaczeń automatycznych i wspomagając ulepszanie tej ważnej technologii. W obliczu coraz bliższych kontaktów między krajami w Europie i na świecie opracowanie metod szybszego i bardziej naturalnego tłumaczenia automatycznego będzie niewątpliwie osiągnięciem korzystnym.

Słowa kluczowe

Automatyczne tłumaczenie, tłumaczenia, technologie językowe, wyrażenia wielowyrazowe, frazeologia

Znajdź inne artykuły w tej samej dziedzinie zastosowania