Rechercher et analyser les opinions en plusieurs langues
Le projet CROSSLINGMIND («Automated analysis of opinions in a multilingual context») a été lancé pour concevoir un système d'analyse de sentiments (ou opinion mining) en plusieurs langues (un CLOM), en utilisant la traduction automatique pour adapter un système monolingue d'analyse des opinions. Le processus appliqué par le système monolingue a été adapté aux types d'informations générées par les utilisateurs des réseaux sociaux, et aux langues intéressantes pour les partenaires professionnels potentiels. Ces travaux ont conduit à la publication de l'article «Selection of correction candidates for the normalization of Spanish user-generated content» dans la revue Natural Language Engineering. Le projet a aussi conçu un processus d'analyse de sentiments pour le portugais. En parallèle, CROSSLINGMIND a conduit une étude approfondie de l'état des lieux en matière de systèmes d'analyses de sentiments en plusieurs langues, mettant un accent particulier sur les algorithmes et les applications translinguistiques utilisées pour le traitement du langage naturel. Par ailleurs, le projet génère un lexique de mots relatifs aux sentiments (le LIWC) en catalan, par triangulation avec des lexiques similaires pour d'autres langues. Le projet CROSSLINGMIND a conçu un système d'analyse de sentiments en plusieurs langues qui effectue une analyse au niveau des aspects des entités qui sont l'objet des opinions exprimées. Le système a été entraîné à partir de données générées par le projet OPENER du septième programme-cadre (7e PC), puis annoté au niveau de l'unité d'opinion dans plusieurs langues, pour le domaine des commentaires sur les hôtels. Le projet a présenté ses activités et ses résultats lors de conférences, et les a utilisés pour réaliser des tutoriels, des cours et des numéros spéciaux dans des revues. Le projet a démontré qu'il est possible de réaliser un système d'analyse des sentiments en plusieurs langues, axé sur l'aspect, et qu'il donne un classement compétitif. Conçu pour une utilisation en situation réelle, il peut rentrer dans le cadre d'un transfert de technologie. Ce système devrait améliorer la compétitivité des entreprises, des organisations et des institutions européennes qui s'appuient sur l'opinion publique pour leur croissance et les changements. Il contribuera aussi à réduire les obstacles de langue qui contrarient les communications et fragmentent les données exploitables et le marché numérique. À terme, le grand public pourrait aussi l'utiliser.
Mots‑clés
Contexte multilingual, recherche d'opinions en plusieurs langues, analyse des sentiments, traduction automatique, analyse d'opinions