Les modèles de signification dans les langues
La théorie des catégories est un domaine des mathématiques qui décrit les relations entre les objets, et qui est capable de restituer les significations subtiles en langage naturel. Cette représentation sera nécessaire pour qu'il soit un jour possible de mettre en place des interfaces vocales réalistes avec des ordinateurs. Le projet MEANCATS (Category theory for meaning assembly and the semantics-pragmatics interface), financé par l'UE, a procédé à la modélisation mathématique de la méthode utilisée par les langues pour véhiculer un sens complexe. Le modèle s'est inspiré de travaux antérieurs sur l'analyse des langages de programmation. Les recherches du projet MEANCATS ont porté sur trois phénomènes linguistiques. La liste comprenait: les «implicatures classiques», qui introduisent les informations de manière indirecte; et les expressions linguistiques pouvant être interprétées de plusieurs points de vue. Le troisième domaine concernait les expressions de l'incertitude dans le langage. Les chercheurs se sont appuyés sur la théorie des catégories pour créer un modèle mathématique généralisé des significations linguistiques complexes. Le modèle a apporté une méthode générale de construction des significations. Il a également débouché sur un calcul logique décrivant la façon dont les significations émergent des unités linguistiques isolées (mots) pour devenir des expressions plus complexes (expressions et phrases). La formulation rigoureuse du projet MEANCATS a permis aux chercheurs d'émettre des hypothèses sur l'utilisation de certains types de significations. Le modèle a révélé des significations qui n'auraient pas été identifiées par les approches classiques. Le niveau d'analyse pourrait être calibré en fonction du besoin, ou en ajoutant ou supprimant des représentations sémantiques. Les chercheurs ont mis en œuvre le modèle et le calcul sous la forme d'un démonstrateur automatisé de théorème. À partir d'un ensemble de ressources linguistiques, le démonstrateur a généré automatiquement les représentations de signification qui intéressaient les chercheurs. Le démonstrateur s'est également avéré beaucoup plus rapide et moins sujet aux erreurs que les méthodes d'analyse sémantique manuelles. Le groupe a aussi intégré le modèle à des cadres grammaticaux, y compris à la grammaire fonctionnelle et à la grammaire catégorielle. Ces cadres ont apporté la chaîne d'outils requise pour pouvoir passer de l'expression linguistique brute à la représentation de la signification. Le modèle du projet MEANCATS a prouvé qu'il était possible de mettre en pratique la théorie des catégories. Les travaux réalisés constituent une étape de plus vers une communication naturelle entre l'homme et la machine.
Mots‑clés
Théorie des catégories, MEANCATS, signification, langue, modèle, calcul logique