Najnowocześniejsze metody badawcze i narzędzia przyspieszające wdrażanie systemów tłumaczenia maszynowego
W ramach projektu finansowanego ze środków unijnych ABU-MATRAN (Automatic building of machine translation) opracowano zestaw narzędzi, które mają przyspieszyć rozwój statystycznych systemów MT i opartych na zasadach systemów MT. Opracował także techniki poprawiania jakości tłumaczeń dla języków bogatych w morfologię. Partnerzy projektu dostarczyli MT dla języka chorwackiego. System MT online dla pary językowej angielski-chorwacki, oparty na publicznie dostępnych zasobach, został wydany w 2013 r., aby zaznaczyć przystąpienie kraju do UE. Był on dalej udoskonalany, z zastosowaniem metody neuronowego podejścia i z wykorzystaniem techniki selekcji danych oraz systemu MT opartego na regułach dla języka serbsko-chorwackiego, rozwijanego wspólnie podczas oddelegowania. Został także wydany chorwacki system MT dla turystyki. Został zbudowany z wykorzystaniem równoległych danych turystycznych pozyskanych z robotów sieciowych w trakcie projektu. Wyniki pokazują, że ten system przewyższa inne systemy online MT dla tej pary językowej i dziedziny. Zespół ABU-MATRAN następnie rozszerzył chorwacki system MT o powiązane języki południowo-słowiańskie krajów kandydujących. Wydano systemy MT dla języka bośniackiego, serbskiego i słoweńskiego. Techniki opracowane dla tych trzech języków zostały zastosowane z powodzeniem dla innych języków, wykazując w ten sposób wysoki poziom niezależności językowej. Mianowicie, naukowcy opracowali systemy MT dla par językowych angielski-fiński, hiszpański-kataloński i hiszpański-baskijski. Przeprowadzono oddelegowania i zorganizowano kilka warsztatów, które miały przekazywać wiedzę w takich sprawach, jak zarządzanie i procesy, od przemysłu do środowisk akademickich. Wydarzenia te miały na celu poprawę jakości badań i rozwoju, a także skoncentrowano się na wydajnym zarządzaniu oprogramowaniem i tworzeniu danych lingwistycznych. Dla skutecznego transferu wiedzy poza projektem, wszystkie zasoby zostały wydane jako darmowe/open-source i są dostępne na stronie internetowej. ABU-MATRAN zidentyfikował kluczowe praktyki badawcze w celu przyspieszenia wdrożenia systemów MT i ich przygotowania do komercyjnego wykorzystania. Co jest tak samo ważne, przekazano tę wiedzę do przemysłu.
Słowa kluczowe
Tłumaczenie maszynowe, ABU-MATRAN, roboty sieciowe