Projektbeschreibung
Instrumentarium für nachhaltige Data Lakes
Data Lakes speichern große Mengen strukturierter, halbstrukturierter und unstrukturierter Daten und erlauben flexible selbst angefertigte Analysen für eine schnelle und sofortige Entscheidungsfindung. Das EU-finanzierte Projekt SmartDataLake gestattet Analysen in extremem Umfang für nachhaltige Big Data Lakes. Es wird ein anpassungsfähiges, skalierbares und flexibles Instrumentarium für die Verwaltung von Data Lakes bieten. Dieses Instrumentarium bietet Datenvirtualisierung zur Abstraktion und Optimierung von Abfragen über heterogene Daten und gleichzeitig die automatische Platzierung von Daten auf verschiedenen Speicherebenen. Es wird außerdem Datenübersichten für die ungefähre Beantwortung von Abfragen und visuelle Analysen anbieten. Der Inhalt des Data Lake wird als heterogenes Informationsnetzwerk modelliert und organisiert, das verschiedene Arten von Einheiten und Beziehungen umfasst. SmartDataLake wird die Ergebnisse in realen Anwendungsfällen aus dem Bereich Geschäftsanalytik bewerten.
Ziel
Data lakes are raw data ecosystems, where large amounts of diverse data are retained and coexist. They facilitate self-service analytics for flexible, fast, ad hoc decision making. SmartDataLake enables extreme-scale analytics over sustainable big data lakes. It provides an adaptive, scalable and elastic data lake management system that offers: (a) data virtualization for abstracting and optimizing access and queries over heterogeneous data, (b) data synopses for approximate query answering and analytics to enable interactive response times, and (c) automated placement of data in different storage tiers based on data characteristics and access patterns to reduce costs. The data lake’s contents are modelled and organised as a heterogeneous information network, containing multiple types of entities and relations. Efficient and scalable algorithms are provided for: (a) similarity search and exploration for discovering relevant information, (b) entity resolution and ranking for identifying and selecting important and representative entities across sources, (c) link prediction and clustering for unveiling hidden associations and patterns among entities, and (d) change detection and incremental update of analysis results to enable faster analysis of new data. Finally, interactive and scalable visual analytics are provided to include and empower the data scientist in the knowledge extraction loop. This includes functionalities for: (a) visually exploring and tuning the space of features, models and parameters, and (b) enabling large-scale visualizations of spatial, temporal and network data. The results of the project are evaluated in real-world use cases from the business intelligence domain, including scenarios for portfolio recommendation, production planning and pricing, and investment decision making. SmartDataLake will foster innovation and enable European SMEs to capitalize on the value of their own data lakes.
Wissenschaftliches Gebiet (EuroSciVoc)
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
- NaturwissenschaftenInformatik und InformationswissenschaftenDatenbank
- NaturwissenschaftenInformatik und InformationswissenschaftenDatenwissenschaftenBig Data
- NaturwissenschaftenInformatik und InformationswissenschaftenDatenwissenschaftenData Mining
- NaturwissenschaftenInformatik und InformationswissenschaftenDatenwissenschaftenGeschäftsanalytik
Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen
Programm/Programme
Aufforderung zur Vorschlagseinreichung
(öffnet in neuem Fenster) H2020-ICT-2018-20
Andere Projekte für diesen Aufruf anzeigenUnterauftrag
H2020-ICT-2018-2
Finanzierungsplan
RIA - Research and Innovation actionKoordinator
151 25 Maroussi
Griechenland