Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

Pas de techniques de traduction à dormir debout

Les traducteurs automatiques sont des technologies relativement nouvelles. Bien qu'ils aient parcouru un long chemin, leur précision et leur polyvalence sont discutables. Une université espagnole vient de développer un traducteur automatique offrant un potentiel beaucoup plus grand par rapport à ces deux aspects.
Pas de techniques de traduction à dormir debout
La grande difficulté des traductions est souvent liée aux termes techniques et aux diverses significations derrière l'utilisation de mots. En outre, dans les entreprises où d'importants volumes de traductions sont requis, la vitesse devient elle aussi un problème.

Les technologies de traitement du langage humain subissent dès lors des pressions afin de fournir des traductions précises dans des temps records. La technologie actuelle traduit grosso modo dix mille mots par seconde avec une précision comprise entre 85 et 90%.

Pour parvenir à ce résultat, les développeurs ont travaillé avec des machines modulaires, travaillant chacune en toute indépendance sur des techniques d'états finis. Ces états finis garantissent la vitesse (qui peut être atteinte sur un ordinateur de bureau standard). Les niveaux de précision élevés sont en partie dus à l'Unicode sur lequel le système repose. L'Unicode tient compte du format RTF (rich text format) du texte, qui peut contenir des jeux de caractères spéciaux tels que ceux rencontrés en polonais. Il permet donc de réduire les incompatibilités.

Ses avantages supplémentaires, tels que son code à exploitation libre et son intégration aisée dans des technologies Internet qui ne contiennent pas de technologies de traduction automatique, en font un produit viable d'un point de vue commercial. Il est dès lors possible d'adapter la technologie en fonction des besoins de l'utilisateur, tout en améliorant les techniques de débogage.

Le traducteur automatique, qui met plus particulièrement l'accent sur les langues latines (romanes), est capable de traiter des structures syntaxiques spécifiques et simples. Cela inclut des fonctions spéciales telles que l'accord en nombre et en genre, le traitement des prépositions et le positionnement correct des éléments syntaxiques.

En outre, la traduction automatique actuellement développée offre la possibilité de traiter des paires de langues minoritaires telles que le provençal, le corse et le sarde. Il existe actuellement un prototype mis au point à des fins de test et les développeurs sont à la recherche de partenaires dans l'industrie, les universités et les centres technologiques.
Numéro d'enregistrement: 82154 / Dernière mise à jour le: 2005-09-18
Domaine: TI, Télécommunications