European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

R4R: Reproducible Data Analyses for All

Descripción del proyecto

Una herramienta de análisis de programas para no programadores que garantiza la reproducibilidad de los análisis

Las conclusiones científicas suelen basarse en análisis detallados y complejos de datos experimentales voluminosos. A medida que los conjuntos de datos aumentan de tamaño y los programas para analizarlos se complican, la reproducibilidad de los análisis —requisito necesario para el éxito científico, el reconocimiento y la financiación— se hace más difícil de comprobar. El equipo del proyecto R4R, financiado por el Consejo Europeo de Investigación, tiene previsto abordar este importante reto con su herramienta «R4R» para no programadores, que agilizará la tarea de garantizar la reproducibilidad de las cadenas de análisis de datos. Centrándose en el «software» de análisis de datos escrito en R, planean utilizar técnicas de análisis dinámico de programas para rastrear dependencias, entradas de datos y otras fuentes de no determinismo que afectan a la reproducibilidad.

Objetivo

Unevaluated science is not worth funding. Gone are the days where a scientific breakthrough could be based on scribbles made on a few loose sheets of paper reviewed by a single attentive reader. Most disciplines rely on experimental data that is collected, analyzed, and presented using powerful computational tools. The scientific adventure hinges on our ability to openly and widely share and reproduce such results.
The goal of this PoC is to market a tool, R4R, for non-programmer scientists to make their archival work easily reproducible and offer it to them through a non-expensive licence. Affordable reproducibility is key to independent evaluation of previously published results.

We will focus on reproducibility of data analysis pipelines written in R with RMarkdown or Jupyter. Creating a reproducible environment is hard, labor-intensive and error-prone, and requires expertise that data analysts lack. We propose to use dynamic program analysis techniques to track dependencies, data inputs, and other sources of non-determinism needed for reproducibility. R4R will synthesize metadata to generate self-contained, portable, fully reproducible environments, based on Docker images.

Palabras clave

Institución de acogida

CESKE VYSOKE UCENI TECHNICKE V PRAZE
Aportación neta de la UEn
€ 150 000,00
Dirección
JUGOSLAVSKYCH PARTYZANU 1580/3
160 00 Praha
Chequia

Ver en el mapa

Región
Česko Praha Hlavní město Praha
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total
Sin datos

Beneficiarios (1)