European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Automated analysis of opinions in a multilingual context

Article Category

Article available in the following languages:

Rechercher et analyser les opinions en plusieurs langues

L'énorme quantité d'opinions personnelles publiée sur Internet aide les entreprises et les institutions à obtenir des retours sur leurs services. Cependant, cette masse d'informations n'est pas toujours dans une même langue, ce qui complique son analyse et son traitement.

Économie numérique icon Économie numérique

Le projet CROSSLINGMIND («Automated analysis of opinions in a multilingual context») a été lancé pour concevoir un système d'analyse de sentiments (ou opinion mining) en plusieurs langues (un CLOM), en utilisant la traduction automatique pour adapter un système monolingue d'analyse des opinions. Le processus appliqué par le système monolingue a été adapté aux types d'informations générées par les utilisateurs des réseaux sociaux, et aux langues intéressantes pour les partenaires professionnels potentiels. Ces travaux ont conduit à la publication de l'article «Selection of correction candidates for the normalization of Spanish user-generated content» dans la revue Natural Language Engineering. Le projet a aussi conçu un processus d'analyse de sentiments pour le portugais. En parallèle, CROSSLINGMIND a conduit une étude approfondie de l'état des lieux en matière de systèmes d'analyses de sentiments en plusieurs langues, mettant un accent particulier sur les algorithmes et les applications translinguistiques utilisées pour le traitement du langage naturel. Par ailleurs, le projet génère un lexique de mots relatifs aux sentiments (le LIWC) en catalan, par triangulation avec des lexiques similaires pour d'autres langues. Le projet CROSSLINGMIND a conçu un système d'analyse de sentiments en plusieurs langues qui effectue une analyse au niveau des aspects des entités qui sont l'objet des opinions exprimées. Le système a été entraîné à partir de données générées par le projet OPENER du septième programme-cadre (7e PC), puis annoté au niveau de l'unité d'opinion dans plusieurs langues, pour le domaine des commentaires sur les hôtels. Le projet a présenté ses activités et ses résultats lors de conférences, et les a utilisés pour réaliser des tutoriels, des cours et des numéros spéciaux dans des revues. Le projet a démontré qu'il est possible de réaliser un système d'analyse des sentiments en plusieurs langues, axé sur l'aspect, et qu'il donne un classement compétitif. Conçu pour une utilisation en situation réelle, il peut rentrer dans le cadre d'un transfert de technologie. Ce système devrait améliorer la compétitivité des entreprises, des organisations et des institutions européennes qui s'appuient sur l'opinion publique pour leur croissance et les changements. Il contribuera aussi à réduire les obstacles de langue qui contrarient les communications et fragmentent les données exploitables et le marché numérique. À terme, le grand public pourrait aussi l'utiliser.

Mots‑clés

Contexte multilingual, recherche d'opinions en plusieurs langues, analyse des sentiments, traduction automatique, analyse d'opinions

Découvrir d’autres articles du même domaine d’application