CORDIS - Résultats de la recherche de l’UE
CORDIS

A Hybrid High Quality Translation System

Article Category

Article available in the following languages:

Une approche mixte de la traduction automatique

La recherche universitaire s'est largement intéressée à la traduction automatique statistique, mais dans la pratique, les architectures basées sur des règles continuent à dominer le domaine. Ceci est dû à plusieurs raisons et inconvénients, des deux côtés.

Économie numérique icon Économie numérique

Le HYGHTRA (A hybrid high quality translation system) a donc proposé une architecture mixte associant les forces des deux approches et minimisant leurs faiblesses en termes de traduction automatique. Le projet a été conduit en collaboration entre un centre d'études universitaires sur la traduction et une société de génie linguistique, tous deux en Allemagne. Les membres du projet ont conçu une méthodologie et créé un ensemble d'outils et de ressources informatiques, qui intègre rapidement de nouvelles langues et orientations de traduction dans un système de traduction automatique basé sur des règle et utilisant des techniques statistiques. Les travaux ont aussi conduit à une infrastructure modulaire de développement. Ceci a ouvert la voie à une nouvelle gamme de produits et de services, que l'entreprise partenaire a ensuite proposé à de nouveaux marchés au-delà de la traduction automatique traditionnelle. Il s'agissait de modules pour l'analyse et la génération linguistiques, de l'extraction de terminologie, et du soutien d'un processus de traduction en collaboration. L'équipe a aussi exploré de nouveaux usages de la traduction automatique, comme l'apprentissage d'une langue et la formation des traducteurs. Elle a proposé une méthode et des scénarios pédagogiquement fondés pour soutenir le processus d'apprentissage avancé d'une langue. Les nouvelles méthodologies sont intéressantes pour dégager des dictionnaires et des grammaires richement annotés à partir de grands ensembles de textes, extraire des bases de données d'équivalents de traduction, démarrer des dictionnaires et des grammaires électroniques pour de nouvelles langues étroitement associées, et effectuer la désambiguïsation statistique de l'application conflictuelle de règles d'analyse. Les chercheurs ont testé dans un but pédagogique, lors d'un module d'université intitulé «English for Translators», des scénarios d'utilisation de la traduction automatique pour obtenir des preuves linguistiques négatives à fins de formation des traducteurs à la langue. Le projet a aussi organisé une série d'ateliers lors de grandes conférences internationales sur la linguistique informatisée. Ces ateliers ont conduit à établir une communauté de chercheurs et de développeurs en traduction automatique, intéressés par des approches mixtes. La principale contribution scientifique du projet HYGHTRA est la conception d'une nouvelle méthode pour bâtir des systèmes mixtes de traduction automatique, en ajoutant des techniques statistiques à une architecture basée sur des règles à large couverture. Le cœur du système reste basé sur des règles, mais les méthodes statistiques autorisent la création rapide de grammaires et de dictionnaires pour de nouvelles orientations de traduction. Ceci contribue à l'exactitude de l'analyse linguistique, et consomme moins de ressources informatiques.

Mots‑clés

Traduction automatique, traduction automatique basée sur des règles, système de traduction, architecture mixte, génie linguistique

Découvrir d’autres articles du même domaine d’application