Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

FP7

ODASP Résultat en bref

Project ID: 331196
Financé au titre de: FP7-PEOPLE
Pays: Italie

Résoudre le problème de la polysémie

Une équipe de l'UE a conçu une nouvelle méthode pour représenter les relations entre les mots et plusieurs sens. Elle a identifié les entrées applicables dans une base de données linguistique, et proposé des solutions à des problèmes linguistiques en matière de recherche de base de données.
Résoudre le problème de la polysémie
Pour un mot ou une phrase, la polysémie consiste à avoir plusieurs sens, connexes. Dans sa forme la plus systématique, ce phénomène linguistique reflète des principes conceptuels profonds, en fonction desquels nous organisons notre compréhension du monde. Ces relations conceptuelles sont aisément traitées par l'homme, mais elles présentent de très grosses difficultés pour les systèmes qui gèrent des informations codées de manière linguistique.

Le projet ODASP (Ontology driven analysis of nominal systematic polysemy in WordNet), financé par l'UE, voulait améliorer la façon de représenter et structurer de manière standard l'information à propos du monde en informatique, par exemple dans les ontologies informatisées. Le projet visait principalement les ontologies bâties sur des catégories et des relations linguistiques. Il voulait s'attaquer aux difficultés de représenter les relations conceptuelles sous-jacentes à la polysémie systématique dans WordNet, une base de données linguistique majeure pour l'anglais. Les chercheurs ont notamment considéré le problème associé de l'héritage multiple, qui est l'une des principales causes du «est un problème de surcharge». Le projet a basé ses méthodologies sur l'ontologie philosophique et la linguistique.

Les chercheurs ont déterminé la proportion d'entrées de WordNet affectées par ce problème. Ils ont ensuite proposé des solutions impliquant un nouveau type de relation sémantique dans WordNet: la «relation de constitution». Cette solution consiste à enrichir la structure de WordNet afin de représenter correctement des concepts complexes, par exemple en formant une hiérarchie linguistique séparée à partir de concepts standard simples.

Les travaux ont conduit à une représentation théorique formelle des relations ci-dessus, dans une ontologie de niveau élevé. Son application aux niveaux supérieurs restructurés de WordNet a autorisé de nouvelles inférences sémantiques. L'ontologie proposée évite les limites des précédentes propositions, en adoptant une approche descendante, basée sur une analyse précautionneuse des contraintes ontologiques et des relations sous-jacentes à la polysémie systématique.

Les travaux ont révélé le problème de catégorisation conceptuelle responsable du phénomène lexical «polysémie nominale inhérente». Ils ont ainsi montré la pertinence des résultats du projet pour les ontologies en général.

Le projet a également facilité le transfert de connaissances. Au niveau universitaire, il a formé un étudiant en maîtrise aux méthodes pertinentes. Le transfert s'est également fait aux niveaux européen et international, via des collaborations de recherche.

Au-delà du phénomène linguistique de la polysémie, les principes de catégorisation d'ODASP pourraient s'appliquer à d'autres systèmes ontologiques afin d'améliorer leurs performances, par exemple pour des bases de données médicales.

Informations connexes

Mots-clés

Polysémie, analyse, WordNet, constitution, relation
Numéro d'enregistrement: 182706 / Dernière mise à jour le: 2016-05-18
Domaine: Technologies industrielles