Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

FP7

HeLeNLP Résultat en bref

Project ID: 256497
Financé au titre de: FP7-PEOPLE
Pays: Israël

Une interface vocale réaliste

Une équipe de l'UE a travaillé sur l'amélioration de la reconnaissance du langage humain par ordinateur. Pour cela, les chercheurs ont alimenté des ordinateurs avec de grandes quantités de matériaux sources sous format préstructuré, traitées à l'aide de nouveaux algorithmes permettant une autostructuration.
Une interface vocale réaliste
Les ordinateurs restent très limités dans le domaine de l'interprétation des communications humaines naturelles. L'une des raisons est que la principale méthode utilisée pour instruire les ordinateurs, l'annotation par des experts, est elle-même lente, coûteuse et sans souplesse.

Le projet HELENLP (Heterogeneous learning for natural language processing), financé par l'UE, avait pour objectif de développer des systèmes aux capacités améliorées pour interagir avec les humains. Le projet s'est concentré sur l'amélioration des performances en ajoutant une nouvelle gamme large de sources numériques, avec des degrés variés d'annotation. À l'aide des algorithmes prévus, les ordinateurs doivent pouvoir être capables d'interpréter automatiquement les sources en effectuant des requêtes à un annotateur. L'équipe avait pour intention de développer des algorithmes d'annotation supplémentaires avec pour objectif final d'améliorer la compréhension par la machine du langage naturel et des textes.

Le travail s'est concentré sur de nouvelles méthodes de calcul et de statistiques pour intégrer et analyser les sources numériques. Les chercheurs ont développé des moyens passifs d'annoter des données partiellement annotées, sans annotateur, ainsi que des méthodes actives utilisant un annotateur. Les nouveaux algorithmes permettent également un apprentissage simultané par combinaison de plusieurs sources de données annotées. Les applications incluent la catégorisation des textes ainsi que la segmentation et la reconnaissance des phonèmes.

L'entreprise a atteint son objectif de réintégration d'un groupe de recherche puissant. Cela a abouti à la création d'un ensemble de chercheurs, des financements supplémentaires et des publications de recherche.

Les nouveaux algorithmes HELENLP pourraient améliorer le traitement informatique des communications humaines naturelles.

Informations connexes

Mots-clés

Ordinateur, langage humain, communication humaine, annotation, traitement du langage naturel
Numéro d'enregistrement: 175270 / Dernière mise à jour le: 2016-03-04
Domaine: TI, Télécommunications