Skip to main content
European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Sustainable Data Lakes for Extreme-Scale Analytics

Opis projektu

Zestaw narzędzi na potrzeby zrównoważonych jezior danych

Jeziora danych to zbiory olbrzymich ilości uporządkowanych, częściowo uporządkowanych oraz całkowicie nieuporządkowanych informacji, które umożliwiają elastyczne przeprowadzanie samodzielnych analiz na potrzeby szybkiego podejmowania decyzji. Zespół finansowanego ze środków Unii Europejskiej projektu SmartDataLake zamierza umożliwić analizę danych w ogromnej skali dzięki zrównoważonym jeziorom mieszczącym duże zbiory danych. W ramach projektu powstanie adaptacyjny, skalowalny i elastyczny zestaw narzędzi do zarządzania jeziorami danych. Obejmie między innymi wirtualizację danych na potrzeby zapewniania warstw abstrakcji oraz optymalizacji zapytań dotyczących zróżnicowanych danych, jednocześnie umożliwiając automatyczne rozmieszczanie danych w różnych magazynach. Nowatorskie rozwiązanie zaoferuje także podsumowania danych, które pozwolą na uzyskiwanie przybliżonych odpowiedzi na zapytania i przeprowadzanie analiz wizualnych. Dane w jeziorze będą modelowane i organizowane jako heterogeniczna sieć informacji obejmująca różne typy encji i relacji. Prace w ramach projektu SmartDataLake obejmą ocenę rzeczywistych przypadków użycia w domenie analityki biznesowej.

Cel

Data lakes are raw data ecosystems, where large amounts of diverse data are retained and coexist. They facilitate self-service analytics for flexible, fast, ad hoc decision making. SmartDataLake enables extreme-scale analytics over sustainable big data lakes. It provides an adaptive, scalable and elastic data lake management system that offers: (a) data virtualization for abstracting and optimizing access and queries over heterogeneous data, (b) data synopses for approximate query answering and analytics to enable interactive response times, and (c) automated placement of data in different storage tiers based on data characteristics and access patterns to reduce costs. The data lake’s contents are modelled and organised as a heterogeneous information network, containing multiple types of entities and relations. Efficient and scalable algorithms are provided for: (a) similarity search and exploration for discovering relevant information, (b) entity resolution and ranking for identifying and selecting important and representative entities across sources, (c) link prediction and clustering for unveiling hidden associations and patterns among entities, and (d) change detection and incremental update of analysis results to enable faster analysis of new data. Finally, interactive and scalable visual analytics are provided to include and empower the data scientist in the knowledge extraction loop. This includes functionalities for: (a) visually exploring and tuning the space of features, models and parameters, and (b) enabling large-scale visualizations of spatial, temporal and network data. The results of the project are evaluated in real-world use cases from the business intelligence domain, including scenarios for portfolio recommendation, production planning and pricing, and investment decision making. SmartDataLake will foster innovation and enable European SMEs to capitalize on the value of their own data lakes.

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.

Aby użyć tej funkcji, musisz się zalogować lub zarejestrować

Zaproszenie do składania wniosków

H2020-ICT-2018-20

Zobacz inne projekty w ramach tego zaproszenia

Szczegółowe działanie

H2020-ICT-2018-2

Koordynator

ATHINA-EREVNITIKO KENTRO KAINOTOMIAS STIS TECHNOLOGIES TIS PLIROFORIAS, TON EPIKOINONION KAI TIS GNOSIS
Wkład UE netto
€ 853 125,00
Adres
ARTEMIDOS 6 KAI EPIDAVROU
151 25 Maroussi
Grecja

Zobacz na mapie

Region
Αττική Aττική Βόρειος Τομέας Αθηνών
Rodzaj działalności
Research Organisations
Linki
Koszt całkowity
€ 853 125,00

Uczestnicy (7)