European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-06-18

Testing the portability of techniques to handle dissimilar source and target languages in MT

Article Category

Article available in the following languages:

Améliorer la traduction automatique

Un projet de recherche de l'UE a fait progresser l'étude de la traduction automatique et promet d'avoir un impact important sur la société et les entreprises. Le projet a produit un système doté d'une architecture améliorée de traduction automatique, apportant un puissant outil aux chercheurs, aux conférenciers et aux étudiants spécialisés dans le traitement du langage naturel.

Économie numérique icon Économie numérique

Le projet ENEUS («Testing the portability of techniques to handle dissimilar source and target languages in MT»), financé par l'UE, a réuni des experts en linguistique, en informatique et en traduction. Les travaux réalisés sont importants pour les utilisateurs de la traduction automatique et pour l'étude des interactions entre les ordinateurs et les langages humains. Le projet ENEUS a mesuré la capacité à porter vers différentes paires de langues l'architecture de traduction automatique Matxin. Il a évalué la capacité du système à utiliser comme source des langues analytiques (comme l'anglais), et des langues agglutinantes (comme le basque) en tant que cible. L'architecture Matxin s'est avérée adaptée à la traduction de langues de même type car elle utilise une analyse approfondie axée sur la morphosyntaxe. Un prototype de traduction automatique basée sur des règles a été conçu au terme d'un travail visant à transposer le système actuel de traduction, qui va de l'espagnol vers le basque, à une traduction de l'anglais vers le basque. Le prototype contient 35 000 entrées. Il peut traduire des phrases simples affirmatives, négatives et interrogatives aux temps de l'indicatif pour les quatre types de relation sujet-objet, aux voix passive et active, et aux temps de l'impératif. L'équipe du projet ENEUS a étudié les caractéristiques de langues agglutinantes que sont le basque, le finnois et le hongrois, ainsi que l'ordre des mots de ces langues et de l'anglais. Les travaux du projet ont montré clairement que les systèmes de traduction automatique ne gèrent pas de manière égale toutes les langues agglutinantes, et qu'une approche plus orientée sur la langue source devrait être envisagée en raison des avantages qu'elle présenterait. L'étude de l'alignement des paires anglais-finnois, anglais-hongrois et anglais-basque a conduit à la conception de systèmes de traduction automatique ENEUS adaptés à toutes les paires. Dans le cadre du programme de sensibilisation ENEUS, plus de 500 utilisateurs ont contribué à la campagne d'évaluation par l'humain. Ils ont comparé quatre systèmes de traduction automatique anglais-basque développés par le projet, ainsi que l'outil de traduction avancée de Google. Les résultats ont montré que le système morphologique et l'outil de traduction de Google étaient équivalents, mais supérieurs aux autres solutions. Le système ENEUS le plus performant a été intégré au Bologna Translation Service à Elhuyar, et les utilisateurs pourront accéder aux prototypes ENEUS depuis le site web Matxin (accessible via Elhuyar). Le système de traduction automatique basé sur des règles est le premier système open source de traduction automatique anglais-basque. Disponible aux développeurs via sourceforge, il permet de concevoir des solutions et de traduire depuis l'anglais et l'espagnol vers n'importe quelle autre langue.

Mots‑clés

Traduction automatique, traitement du langage, linguistique, informatique, langage humain

Découvrir d’autres articles du même domaine d’application