European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Common Language Resources and Technology Infrastructure

Article Category

Article available in the following languages:

Des outils de traitement du langage et de données linguistiques en ligne

Des scientifiques financés par l'UE ont rassemblé des outils de traitement de la parole numériques et des outils de traitement de données linguistiques dans une architecture en ligne. Ils sont tout aussi faciles à utiliser pour des experts en sciences humaines non techniques que pour ceux spécialisés dans des domaines historiquement techniques.

Santé icon Santé

Le langage est ce qui différencie l'homme du reste des animaux et des autres créatures. Comprendre sa structure, son utilisation et son évolution, ainsi que celui de la parole permet de comprendre des domaines aussi variés que les schémas de migration démographique historiques et des critères dans le développement de moteurs de recherche en ligne. Le traitement du langage et de la parole est un domaine multidisciplinaire qui comprend non seulement la linguistique mais également la psychologie, le traitement neuronal et la cognition, l'informatique, le génie électrique, informatique et biomédical, ainsi que les mathématiques. Des chercheurs européens spécialisés dans les sciences humaines et sociales (SHS) ont lancé le projet Clarin («Common language resources and technology infrastructure») pour développer une infrastructure d'outils de traitement et des données linguistiques. L'objectif principal n'était pas de générer de nouvelles connaissances; au contraire, l'équipe s'est basée sur les ressources nationales et européennes importantes déjà disponibles. L'objectif était de poser les bases pour réunir les données et outils actuels dans un cadre commun accessible à toute la communauté de la recherche. L'architecture de données distribuées a été conçue pour offrir des services en ligne aux chercheurs et permettre aux utilisateurs profanes de réaliser des tâches complexes exploitant la richesse des outils de traitement du langage et de la parole développés récemment. Un observatoire virtuel du langage (VLO, http://www.clarin.eu/vlo/) a été créé, permettant l'accès à des données analysées et résumées sur toutes les ressources linguistiques et outils pour les partenaires de Clarin. De nombreuses communautés de SHS ne sont pas familiarisées avec les outils et technologies de traitement linguistique, étant donné qu'il s'agit d'un domaine moins orienté sur la technologie. Réussir à relier ces différentes communautés est un important succès du projet Clarin. En plus des considérations techniques, Clarin s'est également penché sur des problèmes de gouvernance future et de financement dont des travaux sur des modèles organisationnels, juridiques et financiers. Les partenaires du projet ont réussi à mobiliser une grande partie de la communauté des SHS pour poser les fondements d'une infrastructure d'outils et de ressources linguistiques unifiée. En effet, l'accès à cette multitude de données et d'outils permettrait aux scientifiques de répondre à de nombreuses questions restées sans réponse depuis longtemps. De plus, les chercheurs seront en mesure de poser de nouvelles questions qui, en raison de la technologie et des données limitées, n'avaient jamais pu être abordées auparavant. L'infrastructure Clarin a indubitablement ouvert la voie à de nouvelles interprétations étonnantes dans le domaine du traitement de la parole et du langage.

Découvrir d’autres articles du même domaine d’application