Un nouvel éclairage sur le rôle de la science des données, des mégadonnées et des données ouvertes dans la recherche
La manière dont les technologies numériques, les outils de communication et l’essor des mégadonnées affectent les recherches scientifiques est d’une importance cruciale pour l’organisation de la recherche et de l’innovation par les secteurs privé et public. De telles innovations technologiques influencent également la distribution des ressources par les organismes de financement et les institutions politiques.
Conceptualiser les données et leur rôle dans la recherche
Le projet DATA SCIENCE, financé par l’UE, a examiné comment les données sont produites, traitées, diffusées et réutilisées dans diverses situations de recherche. En examinant les pratiques relatives aux données dans six secteurs de recherche, l’équipe a élaboré un cadre conceptuel et méthodologique pour l’analyse qualitative des «data journeys» – les conditions dans lesquelles les données peuvent être mobilisées et réutilisées dans différents contextes – afin d’étendre leur valeur en tant que preuves pour différentes situations de recherche. «Cette méthodologie a influencé le domaine émergent des études de données, et a été largement citée par des universitaires menant des recherches sur la valeur et l’utilisation des données», souligne la principale investigatrice du projet et boursière du Conseil européen de la recherche, Sabina Leonelli. L’étude des pratiques quotidiennes, des inquiétudes et des besoins des chercheurs qui utilisent les données dans leurs travaux a permis de comprendre comment les données peuvent circuler et rester ouvertes. L’un des domaines examiné par les partenaires du projet était le rôle de la sécurité et des questions éthiques dans les stratégies utilisées pour intégrer des données. Un autre domaine portait sur la manière dont les étiquettes, les modèles et les outils de visualisation utilisés par les bases de données affecte l’interprétation des données et leur utilisation en tant que preuves. L’équipe du projet a également analysé les obstacles rencontrés dans la mobilisation des données et l’importance des données manquantes, absentes ou inaccessibles dans la recherche. L’organisation des communautés de la recherche et des institutions pour profiter des larges ensembles de données et des technologies apparentées a aussi fait l’objet d’un examen. L’équipe de DATA SCIENCE a étudié les implications de ses conclusions pour les débats actuels sur la crise de la reproductibilité et les difficultés à évaluer la qualité et la fiabilité des données publiées en ligne.
Ouvrir de nouvelles voies au sein de la philosophie de la science
Le projet est largement reconnu pour avoir contribué à une meilleure compréhension des implications sociales et scientifiques des méthodes recourant intensivement aux données et des transformations numériques associées. Il mènera ainsi à une meilleure gouvernance scientifique et à de meilleures politiques et orientations dans ce domaine. «Nous avons permis de comprendre globalement la manière dont les données de recherche peuvent être gérées et réutilisées, ce qui éclaire à la fois la philosophie, l’histoire et les études sociales de la science, et la prise de décisions scientifiques et politiques relatives aux infrastructures de données», explique Sabina Leonelli. DATA SCIENCE a souligné l’importance de la bonne gestion des données afin de les interpréter de manière fiable, ainsi que le rôle clé joué par les infrastructures de données pour produire une science d’excellence. Sabina Leonelli a présenté ces résultats à des cercles savants issus de différentes disciplines, aux gouvernements nationaux, à la Commission européenne, et à différentes agences et organismes internationaux impliqués dans la science ouverte. «Enfin, DATA SCIENCE est parvenu à produire une nouvelle philosophie de science à forte intensité de données qui place l’information au centre de la recherche scientifique et explique l’émergence et l’impact de la science des données et des mégadonnées, ainsi que les conséquences de ces développements pour la recherche contemporaine», conclut Sabina Leonelli. «Au centre de cette vision se trouve un compte de données relationnel qui montre comment la valeur des données en tant que preuves n’est pas indépendante du contexte, mais tient plutôt des circonstances de leur utilisation.»
Mots‑clés
DATA SCIENCE, données, recherche, recherche scientifique, mégadonnées, infrastructure de données, science à forte intensité de données, qualité des données