Skip to main content
Un site web officiel de l’Union européenneUn site officiel de l’UE
European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

User-Friendly Software For the Quantitative Analysis of Textual Data

Article Category

Article available in the following languages:

Une application web qui offre des outils d’analyse de texte accessibles à tous

Une application web conviviale met à la disposition d’un public plus large des outils de pointe pour l’analyse de texte. Cela inclut les chercheurs qui n’auraient pas d’expérience technique en matière de programmation.

Les outils d’analyse de texte sont utilisés pour extraire des données non structurées sous forme de texte et les transformer en informations structurées et exploitables. Ils comprennent notamment des instruments de préparation et de traitement des textes, ainsi que des dispositifs d’analyse des données ainsi obtenues. «Ces outils sont exploités par des chercheurs qui disposent de grandes quantités d’informations numériques», explique Kenneth Benoit, coordinateur du projet QUANTEDA et professeur de sciences sociales computationnelles à la London School of Economics and Political Science, au Royaume-Uni. «Ces informations peuvent se présenter sous la forme de documents historiques, de littérature, de documents gouvernementaux ou de messages de réseaux sociaux. Des outils analytiques pourraient permettre d’identifier des différences dans les usages linguistiques, ou d’examiner et évaluer les perspectives psychologiques exprimées dans les textes.» Les solutions actuelles se répartissent en deux grandes catégories: les bibliothèques de logiciels pour les programmeurs informatiques et les applications, qui ne nécessitent aucune compétence en programmation, destinées aux utilisateurs finaux. «Bien que les bibliothèques logicielles offrent des capacités techniques étendues, une telle puissance n’est disponible que pour les programmeurs possédant un niveau élevé de connaissances techniques», explique Kenneth Benoit. «Les logiciels conviviaux, en revanche, n’offrent que des fonctionnalités limitées.» Kenneth Benoît a compris la nécessité de mettre les outils d’analyse de texte à la disposition d’un public plus large et que ces derniers soient conviviaux, mais avec un degré élevé de flexibilité et de puissance.

Une puissante analyse de texte

Le projet QUANTEDA a pour objectif de créer des logiciels open-source pour répondre à ce besoin. Un précédent projet financé par le Conseil européen de la recherche, le projet QUANTESS, a joué un rôle essentiel dans le développement de l’arrière-plan de l’application. Kenneth Benoît a voulu s’appuyer sur ce projet pour mettre au point un prototype commercialisable qui ne demanderait aucune expérience en programmation. Le logiciel récemment développé fonctionne entièrement sur un serveur en cloud et est accessible via un navigateur web. Cela signifie que la capacité d’effectuer des analyses puissantes de grands volumes de texte n’est pas limitée par la capacité du matériel de l’utilisateur, ce qui le rend bien plus accessible. Les composants de l’interface ont ensuite été développés et peuvent très facilement être traduits dans n’importe quelle langue. Le programme peut être réalisé en version hindi, chinoise ou espagnole, ou dans toute langue dans laquelle les menus et les pages d’aide ont été traduits. «Nous voulions également nous assurer que cette application web serait financièrement à la portée des étudiants, des chercheurs en début de carrière et des utilisateurs des pays en développement», ajoute Kenneth Benoit. «Pour y parvenir, nous avons établi une politique de prix flexible qui prend en compte la capacité de payer de l’acheteur.» Kenneth Benoit note que de nombreuses applications en ligne, telles que Dropbox, GitHub, RStudio et Slack utilisent avec succès un tel modèle.

Des outils disponibles pour tous

L’application issue de ce dernier projet, appelée Quanteda Guru, est désormais disponible en version d’essai ou à l’achat. «Outre les chercheurs universitaires, nous avons identifié d’autres utilisateurs potentiels qui sont riches en données mais pauvres en informations», remarque Kenneth Benoit. «Il s’agit notamment de professionnels de la santé, en particulier des prestataires de soins, et de services gouvernementaux tels que les ministères de la justice ou de la santé.» Parmi les autres utilisateurs finaux potentiels figurent les sociétés d’intelligence économique et de marketing, qui utilisent souvent les réseaux sociaux, ainsi que les compagnies d’assurance. Celles-ci doivent analyser et évaluer des rapports de risques et d’accidents. Les officiers des forces de l’ordre sont également tenus d’analyser des rapports écrits, tandis que le personnel d’assistance à la clientèle et les centres d’appel doivent souvent étudier et enregistrer des incidents. «Nous travaillons actuellement à ajouter de nouvelles fonctionnalités, à améliorer l’expérience des utilisateurs et à accroître les performances», ajoute-t-il. «Ce qui est formidable, c’est que cette application repose sur une bibliothèque de logiciels open-source. Cela signifie que le code source du moteur d’analyse est ouvert à l’examen, scientifiquement validé et soumis à un développement et à une amélioration continus.»

Mots‑clés

QUANTEDA, en ligne, web, analyse, texte, historique, logiciel, interface, navigateur

Découvrir d’autres articles du même domaine d’application