Neue Erkenntnisse über die Rolle von Datenwissenschaften, Big Data und Open Data in der Forschung
Ein Verständnis der Auswirkungen digitaler Technologien und Kommunikationsmittel sowie des Aufstiegs von Big Data auf die wissenschaftliche Forschung ist unerlässlich für die Art und Weise, wie private und öffentliche Unternehmen Forschungs- und Innovationsbemühungen organisieren. Solche technologischen Innovationen haben auch Einfluss darauf, wie Ressourcen von Fördereinrichtungen und politischen Einrichtungen verteilt werden.
Konzeptualisierung von Daten und deren Rolle in der Forschung
Das EU-finanzierte Projekt DATA SCIENCE untersuchte, wie Forschungsdaten in verschiedenen Forschungsszenarien produziert, verarbeitet, verbreitet und wiederverwendet werden. Das Team analysierte die Vorgehensweisen in sechs Forschungsgebieten und formulierte ein konzeptionelles und methodisches Rahmenwerk zur qualitativen Analyse sogenannter Data Journeys – Bedingungen, bei denen Daten mobilisiert und in verschiedenen Umfeldern wiederverwendet werden können –, um deren Wert als Belege in unterschiedlichen Forschungsszenarien zu steigern. „Diese Methodologie hat sich auf das aufstrebende Feld der Datenwissenschaften ausgewirkt und wurde von Wissenschaftlerinnen und Wissenschaftlern, die den Wert und die Verwendung von Daten erforschen, häufig zitiert“, gibt die leitende Forscherin und Stipendiatin des Europäischen Forschungsrats Sabina Leonelli an. Die Untersuchung der täglichen Gewohnheiten, Bedenken und Bedürfnisse der Forschungsgemeinschaft bezüglich ihrer Datenverwendung bei der Arbeit verschaffte wichtige Erkenntnisse darüber, wie Daten reisen und offen zugänglich gemacht werden können. Die Projektpartner widmeten sich unter anderem der Rolle der Sicherheit sowie von ethischen Bedenken bei Strategien zur Einbindung von Daten. Ein weiteres Kernthema war die Art und Weise, wie von Datenbanken verwendete Labels, Modelle und Visualisierungsinstrumente sich auf die Interpretation der Daten und ihre Verwendung als Belege auswirken. Das Projektteam untersuchte ebenfalls Hindernisse bei der Mobilisierung von Daten und analysierte die Bedeutung verschollener, fehlender oder unzugänglicher Daten für die Forschung. Auch auf der Art und Weise, wie Forschungsgemeinschaften und -einrichtungen organisiert werden können, um aus großen Datensätzen und entsprechenden Technologien Kapital zu schlagen, lag ein zentraler Fokus. Das Team von DATA SCIENCE zog auch die Folgen seiner Feststellungen für die aktuelle Debatte über die Replikationskrise und die Schwierigkeit der Bewertung von Qualität und Zuverlässigkeit von online veröffentlichten Daten in Betracht.
Neue Wege in der Wissenschaftsphilosophie
Dem Projekt wird allgemein bescheinigt, zu einem besseren Verständnis der sozialen und wissenschaftlichen Folgen datenintensiver Verfahren und entsprechender digitaler Umwälzungen beigetragen zu haben. Dies wird zu einer verbesserten wissenschaftlichen Entscheidungsfindung und damit verbundenen Vorschriften und Richtlinien führen. „Wir haben ein allumfassendes Verständnis darüber erarbeitet, wie Forschungsdaten verwaltet und wiederverwendet werden können, das sowohl zu philosophischen, geschichtswissenschaftlichen und sozialwissenschaftlichen Betrachtungen der Wissenschaften als auch zur wissenschaftlichen und politischen Entscheidungsfindung bezüglich Dateninfrastrukturen beigetragen hat“, erklärt Leonelli. DATA SCIENCE hat die Wichtigkeit einer guten Datenverwaltung für die zuverlässige Interpretation von Daten sowie die wichtige Rolle der Dateninfrastrukturen für das Erreichen hervorragender wissenschaftlicher Ergebnisse unterstrichen. Leonelli stellte diese Ergebnisse einem breiten Publikum vor: verschiedenen wissenschaftlichen Gesellschaften mehrerer Disziplinen, nationalen Regierungen, der Europäischen Kommission und zahlreichen Forschungsagenturen und internationalen Einrichtungen für die offene Wissenschaft. „Letztendlich konnte DATA SCIENCE erfolgreich eine neue Philosophie der datenintensiven Wissenschaft etablieren, die Daten in den Mittelpunkt wissenschaftlicher Untersuchungen stellt und das Aufkommen und die Auswirkungen der Datenwissenschaften und von Big Data sowie die Folgen dieser Entwicklungen für die moderne Forschung erklärt“, schließt Leonelli. „Von zentraler Bedeutung ist dabei ein relationaler Ansatz an Daten, der zeigt, dass der Wert von Daten als Belege nicht kontextunabhängig ist, sondern von den Umständen der Datennutzung abhängt.“
Schlüsselbegriffe
DATA SCIENCE, Daten, Forschung, wissenschaftliche Forschung, Big Data, Dateninfrastruktur, datenintensive Wissenschaft, Datenqualität