CORDIS - Résultats de la recherche de l’UE
CORDIS

Grammar-Based Robust Natural Language Processing

Article Category

Article available in the following languages:

Vers une théorie grammaticale plus complète

Des chercheurs financés par l'UE ont cherché à redonner à la théorie grammaticale la place qui lui revient dans la théorie du comportement du langage humain. Le projet a pallié les lacunes associées au problème du formalisme dans les théories fonctionnelles et cognitives de la grammaire, basées sur la sémantique.

Technologies industrielles icon Technologies industrielles

De manière générale, les théories psycholinguistiques actuelles ignorent la théorie linguistique formelle. De plus, les principaux modèles utilisés en linguistique informatique sont généralement des systèmes à état fini de bas niveau ou dépourvus de contexte, reconnus comme étant incomplets face à l'extrême diversité du langage humain. Le projet GRAMPLUS (Grammar-based robust natural language processing) a cherché à proposer une théorie des constructions plus limitée, basée sur un formalisme autorisant une analyse syntaxique efficace et suffisamment expressive pour permettre une interprétation sémantique. L'équipe avait pour objectif d'étendre la théorie linguistique et ses applications informatiques actuelles dans plusieurs directions théoriques, informatiques et appliquées en utilisant la grammaire catégorielle combinatoire. Si la grammaire catégorielle combinatoire est largement adoptée en informatique, les analyseurs syntaxiques qui l'utilisent sont limités par le goulet d'étranglement que constituent les données étiquetées. L'équipe du projet GRAMPLUS a donc proposé plusieurs extensions à la grammaire catégorielle combinatoire et aux applications informatiques associées. L'approche adoptée a permis de réaliser plusieurs avancées, notamment en généralisant l'analyseur syntaxique grâce à l'application de plusieurs méthodes d'apprentissage semi-supervisé à des textes non-étiquetés. L'équipe a aussi mis au point de nouvelles techniques d'analyse syntaxique et d'induction automatique d'analyseur syntaxique sémantique à partir de phrases combinées à des requêtes sur des bases de données. Ces dernières ont été appliquées dans un modèle d'apprentissage du langage chez l'enfant, plausible tant au niveau psychologique que linguistique, basé sur l'exposition à un contexte révélateur de sens. Les travaux ont aussi permis d'améliorer les analyseurs syntaxiques utilisés avec des langues pour lesquelles les ressources sont rares, telles que le hindi, et de combiner sémantique logique et sémantique distributionnelle pour obtenir d'excellents résultats dans le contexte de réponses apportées à des questions. L'équipe est aussi parvenue à démontrer que l'harmonie musicale peut être analysée à l'aide du même type de grammaire catégorielle combinatoire, et avec un algorithme d'analyse syntaxique et un modèle statistique identiques. Les résultats du projet ont un impact au niveau de l'apprentissage automatique et des tâches exigeant une interprétation sémantique. Les méthodes et résultats du projet GRAMPLUS présentent également un intérêt pour les linguistes, psychologues et scientifiques de la cognition, ainsi que pour les personnes intéressées par les applications pratiques du traitement du langage naturel.

Mots‑clés

Théorie grammaticale, langage humain, théorie linguistique, linguistique informatique, GRAMPLUS, sémantique

Découvrir d’autres articles du même domaine d’application