CORDIS - Forschungsergebnisse der EU
CORDIS

R4R: Reproducible Data Analyses for All

Projektbeschreibung

Ein Programmanalyseinstrument für Menschen ohne Programmierfähigkeiten zur Gewährleistung der Reproduzierbarkeit von Analysen

Wissenschaftliche Schlussfolgerungen beruhen in der Regel auf der detaillierten und komplexen Analyse umfangreicher experimenteller Daten. Je größer die Datensätze und je komplizierter die Programme zu ihrer Analyse werden, desto schwieriger wird es, die Reproduzierbarkeit der Analysen zu prüfen – eine notwendige Voraussetzung für wissenschaftlichen Erfolg, Anerkennung und Finanzierung. Im vom Europäischen Forschungsrat finanzierten Projekt R4R soll diese wichtige Herausforderung mit dem „R4R“-Instrument für Menschen ohne Programmierfähigkeiten angegangen werden, das die Reproduzierbarkeit von Datenanalyse-Pipelines vereinfachen soll. Das Projektteam konzentriert sich auf Datenanalysesoftware, die in R geschrieben wurde, und plant, dynamische Programmanalysetechniken zu verwenden, um Abhängigkeiten, Dateneingaben und andere Quellen von Nicht-Determinismus zu verfolgen, die sich auf die Reproduzierbarkeit auswirken.

Ziel

Unevaluated science is not worth funding. Gone are the days where a scientific breakthrough could be based on scribbles made on a few loose sheets of paper reviewed by a single attentive reader. Most disciplines rely on experimental data that is collected, analyzed, and presented using powerful computational tools. The scientific adventure hinges on our ability to openly and widely share and reproduce such results.
The goal of this PoC is to market a tool, R4R, for non-programmer scientists to make their archival work easily reproducible and offer it to them through a non-expensive licence. Affordable reproducibility is key to independent evaluation of previously published results.

We will focus on reproducibility of data analysis pipelines written in R with RMarkdown or Jupyter. Creating a reproducible environment is hard, labor-intensive and error-prone, and requires expertise that data analysts lack. We propose to use dynamic program analysis techniques to track dependencies, data inputs, and other sources of non-determinism needed for reproducibility. R4R will synthesize metadata to generate self-contained, portable, fully reproducible environments, based on Docker images.

Schlüsselbegriffe

Programm/Programme

Gastgebende Einrichtung

CESKE VYSOKE UCENI TECHNICKE V PRAZE
Netto-EU-Beitrag
€ 150 000,00
Adresse
JUGOSLAVSKYCH PARTYZANU 1580/3
160 00 Praha
Tschechien

Auf der Karte ansehen

Region
Česko Praha Hlavní město Praha
Aktivitätstyp
Higher or Secondary Education Establishments
Links
Gesamtkosten
Keine Daten

Begünstigte (1)