CORDIS - Forschungsergebnisse der EU
CORDIS
Inhalt archiviert am 2024-06-18

Automatic building of Machine Translation

Article Category

Article available in the following languages:

Wegbereitende Forschungsmethoden und -instrumente zur Beschleunigung des Einsatzes von Maschinenübersetzungssystemen

Im Zusammenhang mit der Mehrsprachigkeit steht Europa vor einer der größten Herausforderungen überhaupt. Um dieses Problem in den Griff zu bekommen, hat eine EU-Initiative die Industrie- und Hochschulkooperation verstärkt, um das geringe Niveau der industriellen Anwendung bei Maschinenübersetzungen (machine translation, MT) umzukehren.

Digitale Wirtschaft icon Digitale Wirtschaft
Industrielle Technologien icon Industrielle Technologien
Gesellschaft icon Gesellschaft
Grundlagenforschung icon Grundlagenforschung

Das von der EU finanzierte Projekt ABU-MATRAN (Automatic building of machine translation) hat ein Werkzeugpaket erarbeitet, um die Entwicklung statistischer und regelgestützter MT-Systeme zu intensivieren. Es entwickelte gleichermaßen Verfahren zur Verbesserung der Übersetzungsqualität bei morphologiereichen Sprachen. Die Projektpartner schufen eine MT für die kroatische Sprache. Dieses Online-MT-System für Englisch-Kroatisch auf Grundlage öffentlich zugänglicher Ressourcen wurde 2013 veröffentlicht, um den Beitritt des Landes zur EU hervorzuheben. Dem neuronalen MT-Ansatz folgend und unter Einsatz von Datenauswahlverfahren und eines regelbasierten MT-Systems für Kroatisch-Serbisch, das im Laufe von Abordnungen entwickelt wurde, wurde es immer weiter verbessert. Auch ein kroatisches MT-System für den Tourismus wurde veröffentlicht. Es wurde unter Anwendung touristischer Paralleldaten aufgebaut, die man mittels der während des Projekts entwickelten Webcrawlern gewann. Die Resultate belegen, dass dieses System andere Online-MT-Systeme für dieses Sprachpaar und diesen Bereich übertrifft. Das ABU-MATRAN-Team erweiterte im Folgenden das Kroatisch-MT-System auf verwandte südslawische Sprachen von Bewerberländern. Man gab MT-Systeme für die bosnische, serbische und slowenische Sprache frei. Die für diese drei Sprachen entwickelten Verfahren wurden erfolgreich auf weitere Sprachen angewandt. Man demonstrierte damit deren hohe Sprachunabhängigkeit. Im Einzelnen entwickelten die Forscher MT-Systeme für Englisch-Finnisch, Spanisch-Katalanisch und Spanisch-Baskisch. Es erfolgten Abordnungen und mehrere Workshops wurden organisiert, um Wissen zu Themen wie etwa Management und Prozesse von der Industrie bis in die akademische Welt zu transferieren. Diese Veranstaltungen verfolgten das Ziel, Produkte aus Forschung und Entwicklung robuster zu gestalten und konzentrierten sich auf effizientes Softwaremanagement und sprachliche Datenerstellung. Im Sinne eines wirkungsvollen Wissenstransfers noch über das Projekt hinaus wurden alle Ressourcen als freie/quelloffene Software freigegeben und stehen auf der Internetseite zur Verfügung. ABU-MATRAN ermittelte die wichtigsten Forschungspraktiken, um die Markteinführung von MT-Systemen zu beschleunigen und sie zur kommerziellen Nutzung vorzubereiten. Und was ebenso wichtig ist - dieses Wissen wurde der Industrie vermittelt.

Schlüsselbegriffe

Maschinenübersetzung, ABU-MATRAN, Webcrawler

Entdecken Sie Artikel in demselben Anwendungsbereich