WCB publikuje teksty, by pomóc w opracowaniu komputerowych systemów wspomagania tłumaczeń
Wspólne Centrum Badawcze (WCB) UE opublikowało milion zdań przetłumaczonych na 22 języki urzędowe UE, próbując pomóc w opracowaniu technologii i oprogramowania w zakresie komputerowych systemów wspomagania tłumaczeń. Oferując nieodpłatny i otwarty dostęp do tego zbioru zdań UE ma nadzieję, że przyczyni się do promowania wielojęzyczności i zapewni cenne materiały dla twórców systemów oprogramowania umożliwiającego tłumaczenie maszynowe. W ramach posiadanych kompetencji UE tłumaczy wszystkie swoje dokumenty prawne i polityczne na wszystkie 23 języki urzędowe, co oznacza, że tłumacze muszą zajmować się 253 konfiguracjami możliwych par językowych w tekstach liczących 1,5 miliona stron rocznie. Oznacza to również, że istnieje już zbiór tekstów przetłumaczonych, który ma wielką wartość jako baza wiedzy dla twórców systemów. - Dzięki tej inicjatywie Komisja Europejska zamierza przyczynić się do rozwoju technologii językowych, wesprzeć wielojęzyczność oraz zapewnić łatwiejsze, tańsze i bardziej dostępne metody tłumaczenia wspomaganego komputerowo - stwierdził Leonard Orban, unijny komisarz ds. wielojęzyczności. Podczas gdy znalezienie w Internecie dokumentów angielsko-francuskich pomocnych przy tego rodzaju pracach jest stosunkowo łatwe, znacznie trudniejsze jest na przykład wyszukanie kombinacji łotewsko-rumuńskiej. - Dla obywateli pochodzących z mniejszych społeczności językowych dostęp do dokumentów i stron internetowych istniejących wyłącznie w najczęściej stosowanych wersjach językowych stanie się łatwiejszy - mówił dalej komisarz Orban. Ponieważ tekst przytoczony jest łącznie z kontekstem, może również okazać się pomocny przy opracowywaniu i testowaniu programów sprawdzających gramatykę i pisownię, słowników internetowych oraz systemów klasyfikacji tekstów. - Ten wyjątkowy zbiór danych językowych przyczynia się do stworzenia oprogramowania nowej generacji służącego do przetwarzania języka oraz do wzrostu konkurencyjności branży językowej, która obecnie jest jedną z najszybciej rozwijających się branż w UE - powiedział Janez Potočnik, europejski komisarz ds. nauki i badań naukowych.