Skip to main content
Un sito ufficiale dell’Unione europeaUn sito ufficiale dell’UE
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Provenance for Data-Intensive Systems

Descrizione del progetto

Nuovi strumenti per valutare l’affidabilità dei dati

Immaginate un mondo in cui i risultati dei calcoli siano giustificati e spiegati: i sistemi sarebbero trasparenti e controllabili, e i risultati credibili e riutilizzabili. La provenienza o il tracciamento dei dati è la capacità di tracciare le informazioni fino alla fonte originale e di valutare l’affidabilità delle informazioni o della fonte. Il progetto ProDIS, finanziato dall’UE, svilupperà modelli, algoritmi e strumenti che faciliteranno il tracciamento della provenienza per una vasta gamma di sistemi ad alta intensità di dati. Sosterrà la provenienza per l’esplorazione dei dati e la scienza dei dati, nonché per altri contesti di analisi dei dati. Si occuperà anche dell’overhead informatico sostenuto dal tracciamento della provenienza. ProDIS si propone inoltre di sviluppare uno strumento di facile utilizzo per l’analisi fondata sulla provenienza e la validazione sperimentale basata sullo sviluppo di strumenti prototipali e benchmark.

Obiettivo

In the context of data-intensive systems, data provenance captures the way in which data is used, combined
and manipulated by the system. Provenance information can for instance be used to reveal whether
data was illegitimately used, to reason about hypothetical data modifications, to assess the trustworthiness
of a computation result, or to explain the rationale underlying the computation.
As data-intensive systems constantly grow in use, in complexity and in the size of data they manipulate,
provenance tracking becomes of paramount importance. In its absence, it is next to impossible to follow the
flow of data through the system. This in turn is extremely harmful for the quality of results, for enforcing
policies, and for the public trust in the systems.
Despite important advancements in research on data provenance, and its possible revolutionary impact,
it is unfortunately uncommon for practical data-intensive systems to support provenance tracking. The
goal of the proposed research is to develop models, algorithms and tools that facilitate provenance
tracking for a wide range of data-intensive systems, that can be applied to large-scale data analytics,
allowing to explain and reason about the computation that took place.
Towards this goal, we will address the following main objectives: (1) supporting provenance for modern
data analytics frameworks such as data exploration and data science, (2) overcoming the computational
overhead incurred by provenance tracking, (3) the development of user-friendly, provenance-based analysis
tools and (4) experimental validation based on the development of prototype tools and benchmarks.

Meccanismo di finanziamento

ERC-STG - Starting Grant

Istituzione ospitante

TEL AVIV UNIVERSITY
Contributo netto dell'UE
€ 1 306 250,00
Costo totale
€ 1 306 250,00

Beneficiari (1)