Forschungs- & Entwicklungsinformationsdienst der Gemeinschaft - CORDIS

Wegbereitende Forschungsmethoden und -instrumente zur Beschleunigung des Einsatzes von Maschinenübersetzungssystemen

Im Zusammenhang mit der Mehrsprachigkeit steht Europa vor einer der größten Herausforderungen überhaupt. Um dieses Problem in den Griff zu bekommen, hat eine EU-Initiative die Industrie- und Hochschulkooperation verstärkt, um das geringe Niveau der industriellen Anwendung bei Maschinenübersetzungen (machine translation, MT) umzukehren.
Wegbereitende Forschungsmethoden und -instrumente zur Beschleunigung des Einsatzes von Maschinenübersetzungssystemen
Das von der EU finanzierte Projekt ABU-MATRAN (Automatic building of machine translation) hat ein Werkzeugpaket erarbeitet, um die Entwicklung statistischer und regelgestützter MT-Systeme zu intensivieren. Es entwickelte gleichermaßen Verfahren zur Verbesserung der Übersetzungsqualität bei morphologiereichen Sprachen.

Die Projektpartner schufen eine MT für die kroatische Sprache. Dieses Online-MT-System für Englisch-Kroatisch auf Grundlage öffentlich zugänglicher Ressourcen wurde 2013 veröffentlicht, um den Beitritt des Landes zur EU hervorzuheben. Dem neuronalen MT-Ansatz folgend und unter Einsatz von Datenauswahlverfahren und eines regelbasierten MT-Systems für Kroatisch-Serbisch, das im Laufe von Abordnungen entwickelt wurde, wurde es immer weiter verbessert.

Auch ein kroatisches MT-System für den Tourismus wurde veröffentlicht. Es wurde unter Anwendung touristischer Paralleldaten aufgebaut, die man mittels der während des Projekts entwickelten Webcrawlern gewann. Die Resultate belegen, dass dieses System andere Online-MT-Systeme für dieses Sprachpaar und diesen Bereich übertrifft.

Das ABU-MATRAN-Team erweiterte im Folgenden das Kroatisch-MT-System auf verwandte südslawische Sprachen von Bewerberländern. Man gab MT-Systeme für die bosnische, serbische und slowenische Sprache frei. Die für diese drei Sprachen entwickelten Verfahren wurden erfolgreich auf weitere Sprachen angewandt. Man demonstrierte damit deren hohe Sprachunabhängigkeit. Im Einzelnen entwickelten die Forscher MT-Systeme für Englisch-Finnisch, Spanisch-Katalanisch und Spanisch-Baskisch.

Es erfolgten Abordnungen und mehrere Workshops wurden organisiert, um Wissen zu Themen wie etwa Management und Prozesse von der Industrie bis in die akademische Welt zu transferieren. Diese Veranstaltungen verfolgten das Ziel, Produkte aus Forschung und Entwicklung robuster zu gestalten und konzentrierten sich auf effizientes Softwaremanagement und sprachliche Datenerstellung. Im Sinne eines wirkungsvollen Wissenstransfers noch über das Projekt hinaus wurden alle Ressourcen als freie/quelloffene Software freigegeben und stehen auf der Internetseite zur Verfügung.

ABU-MATRAN ermittelte die wichtigsten Forschungspraktiken, um die Markteinführung von MT-Systemen zu beschleunigen und sie zur kommerziellen Nutzung vorzubereiten. Und was ebenso wichtig ist - dieses Wissen wurde der Industrie vermittelt.

Verwandte Informationen

Fachgebiete

Life Sciences

Schlüsselwörter

Maschinenübersetzung, ABU-MATRAN, Webcrawler
Folgen Sie uns auf: RSS Facebook Twitter YouTube Verwaltet vom Amt für Veröffentlichungen der EU Nach oben