Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

Des méthodes et des outils de pointe pour accélérer le déploiement des systèmes de traduction automatique

Le multilinguisme constitue l'un des principaux défis de L'Europe. Pour traiter ce problème, une initiative de l'UE a renforcé la coopération entre l'industrie et les universités, l'objectif étant d'encourager l'emploi par l'industrie des systèmes de traduction automatique, actuellement peu utilisés.
Des méthodes et des outils de pointe pour accélérer le déploiement des systèmes de traduction automatique
Le projet ABU-MATRAN (Automatic building of machine translation), financé par l'UE, a développé un ensemble d'outils pour accélérer le développement de systèmes statistiques de traduction automatique et de systèmes de traduction automatique à base de règles. Il a également mis au point des techniques pour améliorer la qualité des traductions pour les langues dotées d'une morphologie riche.

Les partenaires du projet ont fourni un système de traduction automatique pour le croate. Ce système en ligne de traduction anglais-croate, basé sur des ressources disponibles publiquement, a été publié en 2013 pour marquer l'adhésion du pays à l'UE. Il a ensuite été amélioré en suivant une approche de traduction automatique (TA) à base de réseau neuronal, ainsi qu'en utilisant des techniques de sélection des données et un système de TA à base de règles pour le serbo-croate, qui a été développé en collaboration dans le cadre de détachements.

Le projet a également publié un système de traduction automatique pour le croate et destiné au tourisme. Il a été construit en exploitant des données parallèles sur le tourisme acquises grâce aux robots d'indexation développés au cours du projet. Les résultats montrent que ce système surpasse les autres systèmes de TA en ligne pour cette paire de langues et dans ce domaine.

L'équipe d'ABU-MATRAN a ensuite élargi ce système de TA du croate vers les langues slaves apparentées des pays candidats. Elle a publié des systèmes de TA pour le bosniaque, le serbe et le slovène. Les techniques ainsi développées ont été appliquées avec succès à d'autres langues, démontrant ainsi leur degré élevé d'indépendance par rapport à la langue. Les chercheurs ont notamment développé des systèmes de TA pour les paires anglais-finnois, espagnol-catalan et espagnol-basque.

Des détachements ont été mis en place et plusieurs ateliers ont été organisés pour transférer vers le milieu universitaire des connaissances industrielles sur des sujets tels que la gestion et les processus. Ces initiatives, qui visaient à renforcer la recherche et le développement de produits, se sont axées sur une gestion efficace des logiciels et la création de données linguistiques. Pour transférer effacement les connaissances au-delà du projet, toutes ces ressources ont été rendues publiques sous la forme d'un logiciel gratuit et open-source disponible sur le site du projet.

ABU-MATRAN a identifié des pratiques de recherche essentielles pour intensifier le déploiement de systèmes de TA et les préparer à une exploitation commerciale. Il est également important de noter qu'il a transmis ces connaissances à l'industrie.

Informations connexes

Thèmes

Life Sciences

Mots-clés

Traduction automatique, ABU-MATRAN, robots d'indexation