Skip to main content
European Commission logo print header

Article Category

Actualités
Contenu archivé le 2023-03-02

Article available in the following languages:

Publication du CCR en faveur du développement de systèmes de traduction assistée par ordinateur

Le Centre commun de recherche (CCR) de l'UE a publié un million de phrases traduites en 22 langues officielles de l'UE dans un effort de contribuer au développement de technologies et de logiciels de traduction assistée par ordinateur. L'UE offre un accès libre et ouvert à c...

Le Centre commun de recherche (CCR) de l'UE a publié un million de phrases traduites en 22 langues officielles de l'UE dans un effort de contribuer au développement de technologies et de logiciels de traduction assistée par ordinateur. L'UE offre un accès libre et ouvert à cet ensemble de phrases; elle espère ainsi encourager le multilinguisme et offrir une ressource valable permettant aux développeurs de systèmes de créer un logiciel de traduction automatique. Il est de la compétence de l'UE de traduire l'intégralité de ses documents légaux et politiques dans les 23 langues officielles. En d'autres termes, les traducteurs doivent travailler avec 253 combinaisons de langues possibles pour un volume atteignant les 1,5 million de pages par an. En outre, cet ensemble de textes traduits est d'une valeur inestimable pour les développeurs du système, qui les utilisent en tant que base d'apprentissage. «Grâce à cette initiative, la Commission européenne entend encourager le développement de technologies linguistiques humaines, soutenir le multilinguisme et rendre la traduction assistée par ordinateur plus facile, plus abordable et plus accessible», a déclaré Léonard Orban, commissaire de l'UE en charge du multilinguisme. Le web regorge de documents anglais/français au service de tels développements. Cependant, il est beaucoup plus difficile de trouver des textes en letton ou en roumain, par exemple. «Les citoyens originaires des plus petites communautés linguistiques disposeront d'un accès plus facile aux documents et pages web, qui ne sont actuellement disponibles que dans les langues les plus utilisées», a poursuivi M. Orban. Le texte étant offert dans un contexte bien précis, cette technologie pourrait également contribuer au développement et au contrôle de correcteurs grammaticaux et orthographiques, de dictionnaires en ligne et de systèmes de classification de texte. «Cette collection unique de données linguistiques contribue à la création d'une nouvelle génération d'outils logiciels consacrés au traitement de la langue; de plus, elle contribue à la compétitivité de l'industrie du langage, qui est en croissance fulgurante dans l'Union européenne», a déclaré Janez Potocnik, le commissaire européen en charge de la science et de la recherche.