Les mégadonnées ont le vent en poupe
Des affaires aux sciences, en passant par l’économie et même la finance, les mégadonnées sont omniprésentes. «Grâce aux mégadonnées, les analystes financiers peuvent traiter instantanément des informations concernant des centaines d’actions, les détaillants peuvent garder trace de ce que vous avez acheté lors de votre dernière virée shopping, et les économistes peuvent proposer des prévisions en temps réel sur l’état de l’économie», explique Ines Wilms, chercheuse à l’université de Maastricht. Mais comme le souligne Ines Wilms, avant de pouvoir faire tout cela, il faut disposer des bons outils. «Cela fait des années que les mégadonnées existent, mais nous commençons tout juste à comprendre à quel point il est important de disposer d’une boîte à outils statistiques appropriée pour en extraire les informations qui nous sont utiles», ajoute-t-elle. Avec le soutien du projet BigTime, financé par l’UE, Ines Wilms s’efforce de développer les outils statistiques dont les économistes ont besoin pour prendre des décisions plus sûres en s’appuyant sur les mégadonnées.
Traiter les problèmes liés aux mégadonnées plus efficacement
Grâce à une combinaison de statistiques, d’apprentissage automatique et d’économétrie, le projet a mis au point des méthodes d’apprentissage statistique ainsi que les logiciels correspondants, afin de traiter les problèmes liés aux mégadonnées. La boîte à outils, en particulier, est censée aider les chercheurs, les analystes de données et les étudiants à faire des estimations fiables et des prévisions précises, à quantifier leurs incertitudes et à formuler des inférences sur les effets causaux. «Avec ces méthodes, un utilisateur pourrait par exemple comprendre comment exploiter la masse d’informations considérable d’une banque centrale afin de prévoir le produit intérieur brut d’un pays pour le trimestre en cours et pour le suivant», explique Ines Wilms. «Le modèle pourrait également aider à déterminer les effets de la politique d’une banque centrale au fil du temps.» Le logiciel, baptisé bigtime et désormais accessible au public, a été conçu pour répondre aux besoins de différents types d’utilisateurs. «Pour les utilisateurs experts, nous fournissons l’ensemble du code informatique en open source, associé à une documentation conviviale leur permettant de s’y retrouver facilement», indique Ines Wilms. «Pour les utilisateurs novices, nous proposons des applications web qui les guident dans la découverte des concepts de base des séries chronologiques, et des cas d’utilisation simples.»
Un succès retentissant
Selon Ines Wilms, bigtime connaît déjà un grand succès. «Le logiciel a été téléchargé plus de 25 000 fois», précise-t-elle. «J’ai bon espoir de voir ces chiffres continuer à augmenter, car de plus en plus de chercheurs, d’analystes commerciaux et d’étudiants découvrent le domaine particulièrement riche des mégadonnées.» Même avec ce succès, Ines Wilms est loin d’en avoir terminé. «Le travail accompli grâce au programme Actions Marie Skłodowska-Curie m’a fait prendre conscience qu’il reste encore beaucoup à faire et à découvrir dans le domaine passionnant de l’analyse causale pour les séries chronologiques possédant un nombre élevé de dimensions», ajoute-t-elle. Ines Wilms concentre actuellement ses efforts sur l’emploi de méthodes d’apprentissage statistique dans le cadre des analyses causales, ainsi que sur l’extension de la boîte à outils logicielle. «J’espère faire connaître notre logiciel à un public plus large, hors du milieu universitaire, notamment à des partenaires industriels et commerciaux intéressés», conclut Ines Wilms. «À cette fin, nous avons préparé un cours sur l’analyse et la prévision des séries chronologiques, destiné à la plateforme BlueCourses, qui présente certaines des méthodes développées au cours du projet BigTime.»
Mots‑clés
BigTime, mégadonnées, outils statistiques, économistes, finance, économie, apprentissage automatique, logiciel, open source, séries chronologiques