CORDIS - Forschungsergebnisse der EU
CORDIS

Scalable Understanding of Multilingual Media

Article Category

Article available in the following languages:

Eine Plattform zur Nachrichtenbeobachtung macht die Arbeit von Medienfachkräften einfacher und effizienter denn je

Die Medienbeobachtung ist zu einer Herausforderung geworden, da es nun erforderlich ist, mit einer rasant wachsenden Anzahl von weltweiten Übertragungen und Medienkanälen im Internet umzugehen. Eine EU-Initiative hat sich dieser Herausforderung gestellt, indem sie eine Plattform entwickelte, die große Datenvolumen in vielen Sprachen und aus verschiedenen Medienquellen handhabt.

Digitale Wirtschaft icon Digitale Wirtschaft
Gesellschaft icon Gesellschaft

„Das exponentielle Wachstum von Nachrichtenquellen im Fernsehen, Radio, in der Zeitungsbranche und im Internet bedeutet, das aktuelle Beobachtungsmethoden dem Umfang dieser Aufgabe nicht mehr gewachsen sind“, so Prof. Steve Renals, der Koordinator des EU-finanzierten Projekts SUMMA. Die Medienbeobachtung ist eine komplexe Angelegenheit, bei der mit Daten in vielen Sprachen umgegangen wird sowie eine gewaltige Menge an Audio- und Videodaten automatisch verarbeitet werden. Einbindung ausgefeilter Sprach- und Fremdsprachtechnologien Um Journalisten und Medienbeobachter zu unterstützen, hat SUMMA eine skalierbare, mehrsprachige Beobachtungsplattform entwickelt, die Medienverarbeitungswerkzeuge und Technologien zur Verarbeitung natürlicher Sprache nutzt. Das SUMMA-Team entwarf und entwickelte die Plattform und machte sie einsatzfähig, woraufhin es mehrere Prototypen in Zusammenarbeit mit Journalisten der BBC und der Deutschen Welle erprobte, die beide Partner dieses Projektes sind. Insbesondere entwickelten Projektpartner hochmoderne Spracherkennungs- und automatische Übersetzungssysteme für Deutsch, Englisch, Spanisch, Lettisch, Portugiesisch, Arabisch, Persisch (Farsi), Russisch und Ukrainisch. Die Plattform verarbeitet bislang diese Sprachen, aber sie kann nahezu alle bedeutenden Sprachen abdecken, indem standardmäßige Werkzeuge integriert werden. Die Medienverarbeitungswerkzeuge der quelloffenen Plattform, darunter Spracherkennung, automatische Transkription und automatische Übersetzung, können auf Hunderte Audio- und Videostreams skaliert und ausgeweitet werden, um mit der wachsenden Anzahl von Mediendatenströmen umgehen zu können. Die Plattform ist flexibel, kann auf Veränderungen der Anforderungen des Benutzers reagieren und neue Technologien reibungslos einbinden. Die Beobachtung von Entwicklungen und die Suche nach Trendthemen leicht gemacht Das vollautomatische Beobachtungssystem der Plattform nimmt Inhalte über eine Schnittstelle zur Anwendungsprogrammierung auf. Nach der Aufnahme transkribiert sie automatisch alle Audioinhalte aus Videos und wandelt so Sprache in Text um. Sie übersetzt auch automatisch jegliche Textinhalte – seien es Originaltext oder Text, der aus Sprachinhalten transkribiert wurde – ins Englische. Anschließend nutzt sie das Ergebnis, um einen sprachübergreifenden Überblick der Inhalte zusammenzustellen, verwandte Meldungen in Geschichten zu gruppieren, Geschichten und einzelne Meldungen zusammenzufassen, thematische Schlagwörter und namentlich genannte Organisationen zuzuweisen sowie eine Sentimentanalyse hinzuzufügen. Die BBC nutzt die Ergebnisse von SUMMA, indem sie einen Prototyp einer Transkriptionsengine einsetzt, die über BBC Monitoring aufgenommene Inhalte für die mit der Nachrichtenbeobachtung beschäftigten Journalisten auf benutzerfreundliche Art durchsuchbar macht. Die britische internationale öffentliche Sendeanstalt verwendet ebenfalls ein System, das die Plattform nutzt, um die Teams von BBC World Service auf veröffentlichte Geschichten aufmerksam zu machen, die sich ideal zur Übersetzung eignen würden. Darüber hinaus verwendet die Deutsche Welle SUMMA-Komponenten im Eurovox-Projekt der Europäischen Rundfunkunion, das Standards für automatisierte Sprachverarbeitung wie Übersetzung, Transkription, Untertitelung und Begleitkommentare für Übertragungen entwickelt. Infolge von SUMMA wurden zwei Spin-out-Unternehmen gegründet. Mindflux hat auf der Grundlage der Plattform eine Komplettlösung für durch Automatisierung unterstützte Inhaltslokalisierung entwickelt, um Medien in Produktionsqualität zu übersetzen. Diese Lösung ermöglicht es den Nutzern, jegliche Audio-, Video- oder Textinhalte an einem Ort zu transkribieren, zu übersetzen und unterzutiteln. Hatch AI hat Lösungen für den Finanzdienstleistungsbereich entwickelt, die künstliche Intelligenz und maschinelles Lernen verwenden und auf den Komponenten der Plattform aufbauen. „Mit der SUMMA-Plattform ist es einfacher als je zuvor, Sprachdaten zusammenzufassen, zu strukturieren und zu analysieren“, schließt Prof. Renals. „Medienfachkräfte und Nachrichtenredaktionen auf der ganzen Welt können einfach nach Inhalten filtern, die für sie relevant sind.“

Schlüsselbegriffe

SUMMA, Medien, Inhalte, Medienbeobachtung, Journalisten, Beobachtungsplattform, Medienfachkräfte, automatische Übersetzung

Entdecken Sie Artikel in demselben Anwendungsbereich