Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

Les traductions d'expressions commencent à avoir du sens

Les traductions d'expressions étrangères ne sont souvent pas très correctes. De nouvelles méthodes de traduction automatique devraient permettre de surmonter ce problème.
Les traductions d'expressions commencent à avoir du sens
Les expressions linguistiques sont généralement difficiles à traduire et représentent un défi pour les interprètes et les traducteurs dans un monde de plus en plus interconnecté. Le projet LATEST (Advanced language technology platform for translators), financé par l'UE, a développé une nouvelle approche pour identifier automatiquement les expressions constituées de groupes de mots (collocations) et pour les traduire.

Pour cela, l'équipe de projet a envisagé la traduction des expressions constituées de groupes de mots comme un processus en deux phases. La première consiste à extraire les expressions constituées de groupes de mots dans chacune des langues en question, et la seconde à lancer une procédure de correspondance dans chaque langue pour proposer des traductions équivalentes.

L'approche a contourné l'utilisation de ressources de traduction telles que les dictionnaires, trop chronophage, pour se baser à la place sur des corpus comparables qui ont été compilés à moindre coût. Le projet LATEST a ensuite testé l'approche sur l'anglais et l'espagnol, en se concentrant sur les expressions verbe-nom.

L'équipe de projet a ensuite utilisé des mesures d'association statistiques pendant la phase d'extraction pour estimer la relation entre deux mots et proposer une combinaison de mots en conséquence. Elle a ensuite utilisé des méthodes de similitude de répartition dans la phase de traduction, partant de l'hypothèse que de telles expressions présentent des contextes identiques ou similaires à ceux de leurs équivalentes traduites.

Les textes utilisés pour tester les traductions étaient tirés d'articles d'actualités, ce qui représente une approche qui sera utilisée pour d'autres combinaisons de langues au-delà de la fin du projet. Concernant le respect de la qualité et la taille des corpus comparables, l'équipe de projet a observé que la qualité est plus importante que le volume de données pour obtenir des traductions automatiques précises.

Les résultats du projet ouvrent de nouvelles pistes de recherche dans le domaine de la phraséologie, et en particulier la phraséologie informatique. Les résultats ont été diffusés par le biais d'évènements et de publications auprès des publics pertinents, ouvrant de nouveaux domaines de discussion en traduction automatique pour poursuivre cette quête importante. Alors que les pays d'Europe, et plus largement du monde, se retrouvent de plus en plus imbriqués, la capacité de disposer de traductions rapides et plus naturelles sera très certainement un atout important.

Informations connexes

Mots-clés

Traduction automatique, traduction, technologies langagières, expressions à groupe de mots, phraséologie