Skip to main content
CORDIS - Forschungsergebnisse der EU

Provenance for Data-Intensive Systems


Neue Werkzeuge zur Bewertung der Datenverlässlichkeit

Stellen Sie sich eine Welt vor, in der Berechnungsergebnisse berücksichtigt und erklärt werden: Systeme werden transparent, kontrollierbar und die Ergebnisse glaubwürdig als auch wiederverwendbar. Datenherkunft oder -verfolgung ist die Fähigkeit, Informationen zur ursprünglichen Quelle zurück zu verfolgen und die Zuverlässigkeit der Informationen oder Quelle zu bewerten. Das EU-finanzierte Projekt ProDIS soll Modelle, Algorithmen und Werkzeuge entwickeln, welche die Herkunftsverfolgung für eine Vielzahl datenintensiver Systeme erleichtern. Das Projekt wird sich mit der Herkunftsanalyse beschäftigen, um einen Nutzen für Datenexploration und Datenwissenschaft sowie andere Datenanalyse-Rahmen zu erzielen. Es wird auch auf den Rechenaufwand eingehen, der durch die Herkunftsverfolgung entstehen wird. ProDIS zielt auch darauf ab, ein benutzerfreundliches Werkzeug für die herkunftsbasierte Analyse und experimentelle Überprüfung zu entwickeln, das auf der Entwicklung von Prototyp-Werkzeugen und Richtwerten basiert.


In the context of data-intensive systems, data provenance captures the way in which data is used, combined
and manipulated by the system. Provenance information can for instance be used to reveal whether
data was illegitimately used, to reason about hypothetical data modifications, to assess the trustworthiness
of a computation result, or to explain the rationale underlying the computation.
As data-intensive systems constantly grow in use, in complexity and in the size of data they manipulate,
provenance tracking becomes of paramount importance. In its absence, it is next to impossible to follow the
flow of data through the system. This in turn is extremely harmful for the quality of results, for enforcing
policies, and for the public trust in the systems.
Despite important advancements in research on data provenance, and its possible revolutionary impact,
it is unfortunately uncommon for practical data-intensive systems to support provenance tracking. The
goal of the proposed research is to develop models, algorithms and tools that facilitate provenance
tracking for a wide range of data-intensive systems, that can be applied to large-scale data analytics,
allowing to explain and reason about the computation that took place.
Towards this goal, we will address the following main objectives: (1) supporting provenance for modern
data analytics frameworks such as data exploration and data science, (2) overcoming the computational
overhead incurred by provenance tracking, (3) the development of user-friendly, provenance-based analysis
tools and (4) experimental validation based on the development of prototype tools and benchmarks.


ERC-STG - Starting Grant

Gastgebende Einrichtung

€ 1 306 250,00
69978 Tel Aviv

Auf der Karte ansehen

Higher or Secondary Education Establishments
€ 1 306 250,00

Begünstigte (1)