European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

R4R: Reproducible Data Analyses for All

Opis projektu

Narzędzie do analizy programów dla nie-programistów zapewniające powtarzalność analiz

Wnioski naukowe zazwyczaj opierają się na szczegółowych i złożonych analizach obszernych danych eksperymentalnych. W miarę jak zbiory danych stają się coraz większe, a programy do ich analizy coraz bardziej skomplikowane, powtarzalność analiz — niezbędny wymóg sukcesu naukowego, uznania i finansowania — staje się trudniejsza do przetestowania. Finansowany przez ERBN projekt R4R planuje sprostać temu ważnemu wyzwaniu za pomocą narzędzia „R4R” dla osób niebędących programistami, które usprawni zapewnienie odtwarzalności potoków analizy danych. Zespół projektu, koncentrując się na oprogramowaniu do analizy danych napisanym w języku R, planuje wykorzystać techniki dynamicznej analizy programu do śledzenia zależności, danych wejściowych i innych źródeł niedeterminizmu, które wpływają na odtwarzalność.

Cel

Unevaluated science is not worth funding. Gone are the days where a scientific breakthrough could be based on scribbles made on a few loose sheets of paper reviewed by a single attentive reader. Most disciplines rely on experimental data that is collected, analyzed, and presented using powerful computational tools. The scientific adventure hinges on our ability to openly and widely share and reproduce such results.
The goal of this PoC is to market a tool, R4R, for non-programmer scientists to make their archival work easily reproducible and offer it to them through a non-expensive licence. Affordable reproducibility is key to independent evaluation of previously published results.

We will focus on reproducibility of data analysis pipelines written in R with RMarkdown or Jupyter. Creating a reproducible environment is hard, labor-intensive and error-prone, and requires expertise that data analysts lack. We propose to use dynamic program analysis techniques to track dependencies, data inputs, and other sources of non-determinism needed for reproducibility. R4R will synthesize metadata to generate self-contained, portable, fully reproducible environments, based on Docker images.

Słowa kluczowe

Instytucja przyjmująca

CESKE VYSOKE UCENI TECHNICKE V PRAZE
Wkład UE netto
€ 150 000,00
Adres
JUGOSLAVSKYCH PARTYZANU 1580/3
160 00 Praha
Czechy

Zobacz na mapie

Region
Česko Praha Hlavní město Praha
Rodzaj działalności
Higher or Secondary Education Establishments
Linki
Koszt całkowity
Brak danych

Beneficjenci (1)