European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Global Under-Resourced MEedia Translation

Article Category

Article available in the following languages:

Un projet Horizon 2020 lance la plus grande expérience de traduction automatique dans le domaine de l’information mondiale

Répondant au besoin des médias mondiaux de disposer de traductions rapides et précises dans des langues pour lesquelles les ressources en données sont rares, un projet financé par l’UE a repoussé les limites de la recherche et des solutions pour les salles de presse.

Économie numérique icon Économie numérique

Même si la traduction automatique neuronale progresse à pas de géant, pour de nombreuses langues, les résultats ne sont pas encore assez probants pour être utilisés dans les flux de travail des salles de presse où la précision est primordiale. Le projet GoURMET financé par l’UE entendait améliorer le potentiel de la traduction automatique neuronale pour les paires de langues et les domaines disposant de peu de ressources. GoURMET s’est concentré sur la surveillance des médias, la création de contenu et l’amélioration des domaines relatifs à la santé dans 16 paires de langues peu documentées. Ces langues représentent une audience hebdomadaire potentielle de plus de 120 millions de personnes pour les deux diffuseurs de médias impliqués dans le projet. En tant que tel, le projet constitue la plus grande expérience internationale de TA menée par des diffuseurs d’informations mondiaux. Trois universités européennes leaders dans ce domaine (les universités d’Alicante, d’Amsterdam et d’Édimbourg en tant que coordinatrices) ont travaillé en étroite collaboration avec les équipes d’innovation de la British Broadcasting Corporation (BBC) et de la Deutsche Welle (DW) pour identifier les langues d’intérêt, compiler des données d’entraînement et de test à partir de leur portefeuille de contenus et faire évaluer les résultats par des journalistes natifs. Le projet d’une durée de 42 mois a toutefois été confronté à des défis imprévus. «Ces dernières années, nous avons essuyé une incroyable série de fâcheux contretemps, de la COVID au coup d’État au Myanmar en passant par l’invasion de l’Ukraine», confesse Alexandra Birch, coordinatrice du projet. «La mobilisation des journalistes et des spécialistes linguistiques, qui étaient soumis à une pression énorme en raison de l’impact massif de la COVID-19 sur les flux de production quotidiens, a constitué un véritable défi.» «Les médias ne sont pas les seuls à être sous pression. Nos collaborateurs au Myanmar ont disparu pendant la phase du projet où nous développions les modèles de traduction birmans, car les chercheurs et les universitaires étaient en première ligne des protestations contre la junte militaire», révèle Alexandra Birch.

Améliorer le contenu et les données dans les langues disposant de peu de ressources

Lorsque GoURMET a démarré, les publications de traduction automatique à faibles ressources publiaient des résultats sur des langues européennes disposant de faibles ressources, comme le roumain ou le finnois, ou sur un petit nombre de paires de langues à fortes ressources, comme l’allemand. «Le domaine a énormément progressé, et nous avons pu y jouer un petit rôle», fait remarquer Alexandra Birch. Les chercheurs ont réalisé trois tâches partagées sur des langues à faibles ressources en gujarati, tamoul et haoussa, qui ont bénéficié d’une importante participation tant de l’industrie que du monde universitaire. Ils ont diffusé plus de 80 publications et fourni de meilleures méthodes de collecte de données, de meilleures données elles-mêmes et des modèles plus développés, qui sont disponibles gratuitement.

Préparer l’avenir de la traduction automatique dans les salles de rédaction

Les modèles de GoURMET sont de haute qualité, disponibles gratuitement, facilement accessibles, installables localement et peu coûteux et, par conséquent, compétitifs par rapport aux systèmes commerciaux, qui sont également intégrés. Le cadre que GoURMET a fourni pour explorer et expérimenter de véritables cas d’utilisation des médias a aidé les BBC News Labs à développer une boîte à outils de journalisme multilingue. Elle comprend une plateforme de surveillance permettant de suivre l’évolution de l’actualité dans n’importe quelle langue, ce qui s’est avéré particulièrement efficace lors d’événements mondiaux clés comme la guerre Russie-Ukraine. La boîte à outils intègre également un outil de découverte permettant d’identifier et de réorienter les meilleurs articles originaux, et un générateur de graphiques semi-autonome alimenté par des modèles de TA. News Labs a été présélectionné pour le BBC News Innovation Award et pour le Computing Technology Product Award pour ce travail. La DW est parvenue à intégrer la traduction automatique dans un service de production de transcription, de traduction, de sous-titrage et de voix-off baptisé «plain X», qui sera bientôt déployé auprès de ses journalistes.

Mots‑clés

GoURMET, traduction automatique, médias, langue à faibles ressources, traduction automatique neuronale

Découvrir d’autres articles du même domaine d’application