Gemeinsame Forschungsstelle veröffentlicht Texte, um die Entwicklung computergestützter Übersetzungssysteme zu unterstützen
Die Gemeinsame Forschungsstelle (Joint Research Centre - JRC) der EU hat eine Million Sätze und deren Übersetzungen in 22 EU-Amtssprachen veröffentlicht, um die Entwicklung computergestützter Übersetzungstechnologien und -programme zu unterstützen. Durch die Ermöglichung des freien und offenen Zugangs zu dieser Sammlung erhofft sich die EU, Mehrsprachigkeit zu fördern und eine wertvolle Ressource für Systementwickler bei der Schaffung maschineller Übersetzungsprogramme zu liefern. Als Teil ihrer Aufgaben übersetzt die EU alle Rechtstexte und politische Dokumente in alle 23 Amtssprachen. Die Übersetzer arbeiten mit 253 möglichen Sprachkombinationen und produzieren jährlich etwa 1,5 Millionen Übersetzungsseiten. Dies bedeutet auch, dass es eine Sammlung übersetzter Texte gibt, die als Lerngrundlage für Systementwickler von großem Nutzen ist. "Mit dieser Initiative möchte die Europäische Kommission die Sprachtechnologien voranbringen, die Mehrsprachigkeit fördern und die computergestützte Übersetzung einfacher, billiger und leichter zugänglich machen", sagte der für Mehrsprachigkeit zuständige EU-Kommissar Leonard Orban. Während es relativ leicht ist, englisch/französische Dokumente zur Unterstützung solcher Entwicklungen im Internet zu finden, sind Lettisch und Rumänisch beispielsweise viel schwerer zu finden. "Die Bürger, die den kleineren Sprachgemeinschaften angehören, werden so einen leichteren Zugang zu Dokumenten und Webseiten erhalten, die es oft nur in den häufig verwendeten Sprachen gibt", fuhr Orban fort. Da der Text kontextbezogen angeboten wird, können die Daten auch dabei helfen, Programme zur Grammatik- und Rechtschreibprüfung, Online-Wörterbücher und mehrsprachige Textklassifizierungssysteme zu entwickeln und zu testen. "Dieser einzigartige Sprachdatenbestand trägt zur Schaffung einer neuen Generation von Softwarewerkzeugen für die Verarbeitung menschlicher Sprache bei und wird helfen, die Wettbewerbsfähigkeit der Sprachindustrie weiter zu stärken, die schon heute einer der am schnellsten wachsenden Wirtschaftszweige in der Europäischen Union ist", sagte Janez Potocnik, EU-Kommissar für Wissenschaft und Forschung.