Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Article Category

Zawartość zarchiwizowana w dniu 2023-03-02

Article available in the following languages:

Projekt UE zmierzający do likwidacji barier językowych

Ponad połowa Europejczyków potrafi rozmawiać tylko w języku ojczystym. A jednak wielu z nas pracuje w środowisku wielojęzycznym. W większości wypadków w celu zrozumienia dokumentów w innych językach zdajemy się na profesjonalne lub internetowe usługi tłumaczeniowe, ale to częs...

Ponad połowa Europejczyków potrafi rozmawiać tylko w języku ojczystym. A jednak wielu z nas pracuje w środowisku wielojęzycznym. W większości wypadków w celu zrozumienia dokumentów w innych językach zdajemy się na profesjonalne lub internetowe usługi tłumaczeniowe, ale to często prowadzi do niedokładnych wyników. Celem niedawno uruchomionego projektu SMART (Statistical Multilingual Analysis for Retrieval and Translation - statystyczna analiza wielu języków w celu wyszukiwania i tłumaczenia), finansowanego ze środków UE, jest pomoc w zmniejszeniu takich barier językowych przez zastosowanie technik statystycznego tłumaczenia maszynowego. Statystyczne tłumaczenie maszynowe (SMT) jest modelem tłumaczenia maszynowego, w którym tłumaczenia są generowane na podstawie teoretycznych modeli statystycznych i informatycznych. Wyraz lub fraza są tłumaczone na jedną z kilku możliwości na podstawie prawdopodobieństwa ich wystąpienia w aktualnym kontekście. Techniki te są szczególnie obiecujące dla celów translatorskich, ponieważ wyniki uzyskiwane przy ich zastosowaniu są takie same albo lepsze niż wyniki uzyskane przy wykorzystaniu systemów tłumaczenia opartych na regułach, wymagających ręcznego wprowadzania dużej liczby "reguł" przez przeszkolonych językoznawców, a jest to niewielki fragment całej pracy. Metody te mają jednak pewne stwierdzone niedostatki. Na przykład, chociaż tłumaczenia przy użyciu statystycznego tłumaczenia maszynowego (SMT) są na ogół dokładniejsze pod względem leksykalnym niż tłumaczenia tych samych tekstów oparte na regułach, teksty, które powstają w ich wyniku, są często mniej płynne. Oprócz tego systemy SMT są programowane w trybie seryjnym i nie są w stanie dostosowywać się do informacji od użytkownika. - W przeszłości było wiele zastosowań technik uczenia maszynowego do tłumaczenia maszynowego - mówi dr Craig Saunders, partner projektu z Wydziału Elektroniki i Informatyki Uniwersytetu w Southampton. - Celem projektu jest rozbudowanie bardziej tradycyjnych metod opartych o modele log-liniowe, a także zastosowanie nowych osiągnięć w uczeniu maszynowym do ustrukturyzowanego przewidywania, które doprowadziło do opracowania wielu nowych skutecznych technik wykazujących duży potencjał w tej dziedzinie. W ciągu najbliższych trzech lat konsorcjum SMART, którym kieruje Europejskie Centrum Badawcze firmy Xerox we Francji, zastosuje udoskonalone statystyczne techniki uczenia maszynowego do scenariuszy trzech użytkowników, wykorzystując język angielski, francuski, hiszpański i słoweński. Pierwszy scenariusz skupi się na doskonaleniu systemów wykorzystywanych przez profesjonalnych tłumaczy. Obecnie w takich systemach zgromadzono wiele utartych zwrotów, ale jeśli wyraz jest przetłumaczony błędnie, system sam nie może wprowadzić korekty, wyjaśnił dr Saunders. - Będziemy zastanawiać się, co można zrobić, żeby te systemy stały się bardziej dostosowawcze - powiedział. Drugi scenariusz bada sytuację, w której znajdują się analitycy zajmujący się telefoniczną obsługą klienta. - Może się zdarzyć tak, że pracownik techniczny, którego językiem ojczystym jest jeden język, szuka informacji w materiałach opracowanych w innym języku, a rozmawia z klientem w trzecim języku - zauważył dr Saunders. W przypadku, kiedy analityk jest rodowitym użytkownikiem języka angielskiego z powierzchowną zaledwie znajomością języka niemieckiego, można zaprojektować interfejs w oparciu o uczenie maszynowe w taki sposób, aby analityk mógł wpisać wyszukiwany element po angielsku i znaleźć dokument w języku niemieckim. Na dalszym etapie opracowania taki system mógłby nawet zaznaczać odpowiednie fragmenty tekstu lub słowa kluczowe w uzyskanych wynikach. Scenariusz trzeciego użytkownika wreszcie zakłada umożliwienie użytkownikowi dostępu do części zasobów wielojęzycznej Wikipedii w językach, które zna w ograniczonym zakresie. Scenariusze zostaną zastosowane w rzeczywistych środowiskach handlowych i będą w nich uczestniczyć grupy użytkowników z małych i średnich przedsiębiorstw (MŚP) zorientowanych na innowacje oraz z firmy Xerox. - Nowe techniki uczenia maszynowego po raz pierwszy zostaną wykorzystane w ten sposób - powiedział dr Saunders. - Pracownicy firmy Xerox mają do czynienia z wieloma różnymi językami i w tym kontekście dostęp do informacji w różnych językach byłby bardzo przydatny; możliwość zadania pytania w jednym języku, a w odpowiedzi otrzymania dokumentów w innym jest przydatna w wielu różnych zastosowaniach. - Tak naprawdę to staramy się opracować techniki, które generalnie będą pomagać wszystkim obywatelom UE, ale jeśli chcemy postarać się ocenić postęp w sposób ilościowy, łatwiej jest to zrobić w warunkach przemysłowych - powiedział serwisowi CORDIS Wiadomości dr Saunders. - Na zakończenie projektu, jeśli techniki te okażą się skuteczne, chcemy rzeczywiście przygotować kilka wersji demonstracyjnych do udostępnienia w sieci tak, żeby wszyscy mogli z tego skorzystać.

Moja broszura 0 0