CORDIS - Forschungsergebnisse der EU
CORDIS

European Language Grid

Article Category

Article available in the following languages:

Eine zentrale Anlaufstelle für europäische Sprachtechnologien

Neben den 24 offiziellen Sprachen der EU-Mitgliedstaaten gibt es noch viele inoffizielle, was eine bedeutende Herausforderung für einen wahrhaft digitalen Binnenmarkt darstellt. Die cloudbasierte Plattform des Projekts ELG ist für Sprachtechnologien konzipiert und könnte Abhilfe schaffen.

Gesellschaft icon Gesellschaft

Sprachtechnologien verarbeiten oder generieren natürliche Sprache in geschriebener oder gesprochener Form, wie automatische Textübersetzungen oder Diktiergeräte. Sie könnten den europäischen digitalen Binnenmarkt unterstützen. Doch viele dieser Technologien sind sprachspezifisch. „Die europäische Gemeinschaft rund um Sprachtechnologien ist zersplittert und fokussiert sich ohne Anreiz, mit weniger geläufigen Sprachen zu arbeiten, hauptsächlich auf Englisch und vielleicht Spanisch, Französisch und Deutsch. Es muss eindeutig eine Verbindung zwischen Sprachtechnologien und der kommerziellen und wissenschaftlichen Entwicklung aufgebaut werden“, sagt der Projektkoordinator von ELG, Georg Rehm vom Deutschen Forschungszentrum für Künstliche Intelligenz, dem Projektträger. Dieses Projekt hat mit Unterstützung der EU die European Language Grid geschaffen, eine übergeordnete, cloudbasierte Plattform für Sprachtechnologie, auf der verschiedene Instrumente, Dienste, Datensätze und Ressourcen zusammen mit der Entwicklungsgemeinschaft gesammelt werden. „ELG ist ein Marktplatz, auf dem interessierte Parteien die Sprachtechnologie finden können, die am besten zu ihren Anforderungen passt“, ergänzt Rehm. Derzeit verfügt die Plattform über etwa 10 000 Datensätze und andere Ressourcen sowie über 3 600 Instrumente, die auf der Plattform verwendet werden können, und mehr als 1 700 europäische Organisationen im Bereich der Sprachtechnologien.

Der Ansatz mit Mikrodiensten

Der Entwurf der ELG-Plattform wurde durch Mikrodienste inspiriert – das sind kleine Anwendungen mit nur einem Zweck, die einen Großteil der modernen Softwaretechnik antreiben. Einzelne Instrumente werden zu virtuellen Containern zusammengefasst und so als Mikrodienste in die Plattform integriert. Dort stehen sie dann über die ELG-Website und Cloud-API zur Verfügung. Der Ansatz erlaubt Skalierbarkeit, sodass die Plattform mit zunehmendem Bedarf organisch wachsen kann, indem mehr Hardware-Ressourcen hinzugefügt werden. Wenn Ressourcen hinzugefügt werden, werden deskriptive Metadaten – wie unterstützte Sprache/n, Entwickler usw. – eingefügt, sodass sie leicht über die Suchfunktion gefunden werden können.

Anlauf nehmen

Der erste funktionierende Prototyp stand zehn Monate nach Projektbeginn bereit und wurde internen Tests unterzogen, bevor Mitglieder eingeladen wurden. „Die Rückmeldungen waren phänomenal: Viele erkannten die Lücke an, die wir ausfüllen, und sprachen auf unserer Jahreskonferenz, META-FORUM, über die Vorteile der Plattform“, merkt Rehm an. Das Projekt bot auch finanzielle Unterstützung in Höhe von insgesamt 2 Mio. EUR für Drittprojekte, um neue Instrumente für die ELG-Plattform zu schaffen oder die bereits vorhandenen innovativ anzuwenden. Fünfzehn Projekte wurden ausgewählt, deren Ergebnisse auf der Plattform veröffentlicht wurden.

Umfassend eingebettet

ELG entspricht direkt einer zentralen Empfehlung in der Entschließung des Europäischen Parlaments „Gleichstellung von Sprachen im digitalen Zeitalter“, in der eine „europäische Plattform für Sprachtechnologien“ gefordert wird. Das Projekt trägt auch dazu bei, Sprachen vor dem digitalen Aussterben zu bewahren, indem weniger gesprochene Sprachen eingebunden werden. Für eine bessere Übersicht ist die ELG-Plattform Host für das interaktive Dashboard des Schwesterprojekts ELE, auf dem das Ausmaß der technologischen Unterstützung für einzelne Sprachen visualisiert wird. „Die bereits voll funktionsfähige ELG-Cloud-Plattform erweckt viel kommerzielles Interesse, insbesondere von kleineren kommerziellen Entwicklern in diesem Bereich, die in neue geographische Regionen und Märkte vordringen wollen“, erklärt Rehm. Derzeit ist die Initiative von ELG in mehrere neue Forschungsprojekte eingebunden. ELE greift zum Beispiel auf sie zurück, um Bewertungen der digitalen Gleichstellung von Sprachen auf der Grundlage der verfügbaren Dienste und Ressourcen im ELG pro Sprache festzulegen. Das vom Bundesministerium für Wirtschaft und Klimaschutz finanzierte OpenGPT-X modifiziert die Plattform, um für Kompatibilität mit dem aufkommenden Ökosystem Gaia-X zu sorgen. Das ELG-Konsortium hat auch ein Buch mit Kapiteln zu den Technologien, Diensten und Ressourcen der Plattform sowie Informationen zu den 15 finanzierten Projekten zusammengestellt. „Die größte Herausforderung ist nun, die ELG in eine ‚lebendige‘ Plattform zu verwandeln, die aktiv von der gesamten europäischen Gemeinschaft für Sprachtechnologien verwendet wird“, schließt Rehm. In diesem Sinne richtet das Team eine gemeinnützige Organisation ein, um die ELG-Plattform zu warten und auszuweiten.

Schlüsselbegriffe

ELG, Sprache, Cloud, digitaler Binnenmarkt, Mikrodienste

Entdecken Sie Artikel in demselben Anwendungsbereich