Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Article Category

Contenu archivé le 2023-03-02

Article available in the following languages:

Un projet de l'UE pour éliminer les barrières de la langue

Plus de la moitié des Européens ne peuvent tenir une conversation que dans leur langue maternelle. Or, nous sommes nombreux à travailler dans des environnements multilingues. La plupart d'entre nous avons recours aux services de traduction professionnelle ou en ligne, qui nous...

Plus de la moitié des Européens ne peuvent tenir une conversation que dans leur langue maternelle. Or, nous sommes nombreux à travailler dans des environnements multilingues. La plupart d'entre nous avons recours aux services de traduction professionnelle ou en ligne, qui nous aident à comprendre des documents dans d'autres langues, mais dont les résultats sont souvent inexacts. L'analyse statistique multilingue pour l'extraction et la traduction (Statistical Multilingual Analysis for Retrieval and Translation - SMART), un projet financé par l'UE récemment lancé, vise à contribuer à l'élimination de telles barrières de la langue en appliquant des techniques de traduction automatique statistique. La traduction automatique statistique (Statistical machine translation - SMT) est un exemple de traduction automatique à travers laquelle les traductions sont générées sur la base de modèles théoriques statistiques et d'information. Un mot ou une expression est traduit selon l'une des nombreuses possibilités basées sur la probabilité de sa pertinence dans le contexte en question. Ces techniques sont particulièrement prometteuses pour la traduction, leurs performances étant de qualité équivalente ou supérieure à celles des systèmes de traduction basés sur des règles qui requièrent la saisie manuelle d'un grand nombre de «règles» par des linguistes expérimentés; ces dernières ne représentent par ailleurs qu'une fraction de l'effort de développement. Certains défauts ont cependant été identifiés dans ces méthodes. Par exemple, bien que les traductions soient souvent plus exactes du point de vue lexical en utilisant des systèmes de traduction automatique statistique (SMT) plutôt que leurs homologues basés sur des règles, le texte produit a tendance à être moins fluide. Par ailleurs, les systèmes SMT sont formés en modes «par lots» et ne sont pas adaptables à la rétroaction des utilisateurs. «La traduction automatique a donné lieu à de nombreuses applications de techniques d'apprentissage automatique dans le passé», déclare le Dr Craig Saunders, partenaire du projet de l'École d'électronique et d'informatique (School of Electronics and Computer Science - ECS) de l'Université de Southampton. «Le projet vise à développer les méthodes les plus traditionnelles basées sur des modèles log-linéaires, et également à mettre en pratique les développements récents concernant l'apprentissage automatique pour des prévisions structurées ayant conduit à de nombreuses techniques puissantes présentant un potentiel énorme dans ce domaine.» Au cours des trois prochaines années, le consortium SMART, dirigé par le centre de recherche européen Xerox, en France, mettra en pratique des techniques d'apprentissage automatique statistique améliorées auprès de trois scénarios d'utilisateurs prenant en compte l'anglais, le français, l'espagnol et le slovène. Le premier scénario se concentrera sur l'amélioration des systèmes utilisés par des traducteurs professionnels. À l'heure actuelle, ces systèmes emmagasinent beaucoup d'expressions consacrées, mais si un mot est mal traduit, le système ne peut pas se corriger lui-même, explique le Dr Saunders. «Nous essayons de rendre ces systèmes plus adaptables», a-t-il déclaré. Le second scénario considère la situation du point de vue des analystes de la satisfaction client travaillant dans des centres d'appels. «La situation peut être la suivante: le technicien parle sa langue maternelle, consulte un manuel dans une autre langue et communique avec le client dans une troisième langue», note le Dr Saunders. Dans le cas où l'analyste parle anglais et possède quelques vagues notions d'allemand, une interface pourrait être conçue sur la base de l'apprentissage automatique pour permettre à l'analyste de saisir une recherche en anglais afin de trouver un document en allemand. Le développement plus poussé d'un tel système pourrait aboutir au surlignage dans les résultats trouvés de passages pertinents d'un texte ou de mots-clés. Enfin, le troisième scénario d'utilisateur permettrait à ce dernier d'avoir accès à certaines parties de l'encyclopédie multilingue Wikipédia dans des langues qu'il maîtrise de façon limitée. Les scénarios seront appliqués dans de vrais environnements commerciaux, mettant en jeu des groupes d'utilisateurs de petites et moyennes entreprises (PME) axées sur l'innovation et le groupe Xerox. «C'est la première fois que des nouvelles techniques d'apprentissage automatique sont utilisées de cette façon», affirme le Dr Saunders. «Le groupe Xerox travaille dans beaucoup de langues différentes et l'accès transversal aux informations linguistiques pourrait s'avérer très utile dans ce contexte; procéder à une requête dans une langue et recevoir des documents dans une autre est utile pour une large gamme d'applications.» «Nous essayons vraiment de développer des techniques qui aideront les citoyens de l'UE en général, mais le cadre industriel se prête mieux à l'évaluation de l'amélioration de façon quantitative», a déclaré le Dr Saunders à CORDIS Nouvelles. «À la fin du projet, si les techniques s'avèrent efficaces, nous souhaiterions vraiment mettre à disposition certaines démos sur le web accessibles au grand public.»

Mon livret 0 0