CORDIS - Forschungsergebnisse der EU
CORDIS

Global Under-Resourced MEedia Translation

Article Category

Article available in the following languages:

Horizont 2020-Projekt realisiert größtes Experiment mit maschineller Übersetzung in den internationalen Nachrichten

Als Antwort auf den Bedarf der weltweiten Medien an schnellen und genauen Übersetzungen in Sprachen mit knappen Datenressourcen hat ein EU-finanziertes Projekt die Grenzen von Forschung und Redaktionsarbeit erweitert.

Digitale Wirtschaft icon Digitale Wirtschaft

Zwar verzeichnet die neuronale maschinelle Übersetzung rasante Fortschritte, doch sind die Ergebnisse für viele Sprachen noch nicht zuverlässig genug, um in Redaktionsabläufen eingesetzt zu werden, bei denen es in erster Linie auf Genauigkeit ankommt. Das EU-finanzierte Projekt GoURMET zielte darauf ab, das Potenzial neuronaler maschineller Übersetzungen für ressourcenarme Sprachpaare und Domänen zu verbessern. Im Vordergrund von GoURMET standen Medienbeobachtung, die Erstellung von Inhalten und die Verbesserung von Gesundheitsinhalten in 16 ressourcenarmen Sprachpaaren. Für diese Sprachen ergibt sich ein potenzielles wöchentliches Publikum von über 120 Millionen für die beiden Medienanstalten. Damit ist das Projekt das größte internationale Experiment im Bereich der maschinellen Übersetzung durch internationale Nachrichtensender. Drei auf diesem Gebiet führende europäische Universitäten (die Universitäten Alicante, Amsterdam und Edinburgh als Koordinator) arbeiteten eng mit den Innovationsteams der British Broadcasting Corporation (BBC) und der Deutschen Welle (DW) zusammen, um diejenigen Sprachen zu ermitteln, die für das Projekt von Interesse sind, Schulungs- und Testdaten aus ihrem Inhaltsportfolio zusammenzustellen und die Ergebnisse von muttersprachlichen journalistisch Tätigen bewerten zu lassen. Das 42 Monate währende Projekt sah sich jedoch unerwarteten Herausforderungen gegenüber. „In den letzten Jahren hatten wir eine unglaubliche Flut von schlechten Nachrichten, von COVID über den Putsch in Myanmar bis hin zur Invasion in der Ukraine“, räumt Projektkoordinatorin Alexandra Birch ein. „Die Herausforderung bestand darin, Journalistinnen und Journalisten sowie Fachleute aus dem Sprachbereich einzubinden, die aufgrund der massiven Auswirkungen von COVID-19 auf die täglichen Produktionsabläufe unter enormen Belastungen litten.“ „Nicht nur die Medien gerieten unter Druck. Unsere Mitarbeitenden in Myanmar verschwanden während der Projektphase, in der wir die birmanischen Übersetzungsmodelle entwickelten, da Forschung und Lehre an der Spitze der Proteste gegen das Militär standen“, berichtet Birch weiter.

Verbesserte Inhalte und Daten in unzureichend mit Ressourcen versorgten Sprachen

In der Anfangszeit von GoURMET wurden die Ergebnisse der maschinellen Übersetzung in ressourcenarmen europäischen Sprachen wie Rumänisch oder Finnisch oder in kleinen Mengen von ressourcenreichen Sprachpaaren wie Deutsch veröffentlicht. „Das Gebiet hat enorme Fortschritte gemacht, und wir konnten einen kleinen Teil dazu beitragen“, merkt Birch an. Die Forschenden führten drei gemeinsame Aufgaben zu ressourcenarmen Sprachen in Gujarati, Tamil und Hausa durch, an denen sich sowohl die Industrie als auch die Wissenschaft stark beteiligte. Es wurden über 80 Publikationen veröffentlicht und bessere Methoden zur Datenerfassung, die Daten selbst und Modelle bereitgestellt, die frei verfügbar sind.

Weichenstellung für die Zukunft der maschinellen Übersetzung in Nachrichtenredaktionen

Die Modelle von GoURMET sind qualitativ hochwertig, quelloffen, leicht zugänglich, lokal installierbar und kostengünstig und damit wettbewerbsfähig gegenüber kommerziellen Systemen, die ebenfalls integriert sind. Der Rahmen, den GoURMET für die Erforschung und Erprobung echter Anwendungsfälle in den Medien geschaffen hat, half den BBC News Labs bei der Entwicklung eines mehrsprachigen Instrumentariums für den Journalismus. Es beinhaltet eine Überwachungsplattform, um sich entwickelnde Nachrichten in jeder Sprache zu verfolgen, was sich insbesondere während weltweiter Schlüsselereignisse wie dem Krieg zwischen Russland und der Ukraine als wirksam erwiesen hat; ein Recherchetool, um die besten Originalbeiträge zu ermitteln und aufzubereiten, und einen halbautonomen Grafikgenerator, der auf Grundlage von Modellen der maschinellen Übersetzung arbeitet. Für diese Arbeit wurde News Labs in die engere Auswahl für einen BBC News Innovation Award und einen Computing Technology Product Award aufgenommen. Die Deutsche Welle hat die maschinelle Übersetzung erfolgreich in einen Transkriptions-, Übersetzungs-, Untertitelungs- und Voiceover-Dienst mit der Bezeichnung „plain X“ integriert, der demnächst für die Journalistinnen und Journalisten des Unternehmens eingeführt wird.

Schlüsselbegriffe

GoURMET, maschinelle Übersetzung, Medien, ressourcenarme Sprache, neuronale maschinelle Übersetzung

Entdecken Sie Artikel in demselben Anwendungsbereich