Descripción del proyecto
Descubrimiento y gestión de datos más sencillos
Los datos son un activo que estimula la innovación, impulsa la toma de decisiones, mejora las operaciones y repercute en la ciencia, el medio ambiente, la salud, la energía, la educación, la industria y la sociedad en general. Sin embargo, la vasta cantidad de datos sigue estando, en su mayor parte, inexplorada e infrautilizada. El equipo del proyecto DataGEMS, financiado con fondos europeos, pretende cambiar esta situación ofreciendo un ecosistema de descubrimiento y gestión de conjuntos de datos de nueva generación que proporcionará algoritmos para hacerlos descubribles, combinables y explorables. En DataGEMS se desarrolla tecnología punta de gestión de datos, procesamiento del lenguaje natural y aprendizaje automático para descubrir y analizar conjuntos de datos de distintas modalidades, como datos tabulares, documentos de texto, gráficos de conocimiento e imágenes. El objetivo principal es obtener conocimientos nuevos sobre grandes cantidades de conjuntos de datos complejos y heterogéneos proporcionando herramientas intuitivas. En DataGEMS se promueve la imparcialidad de los datos en ámbitos clave como la educación, la meteorología y la lingüística.
Objetivo
DataGEMS is a data discovery platform with Generalized Exploratory, Management, and Search capabilities. DataGEMS is built on the principles of data FAIRness, openness and re-use. It aims to seamlessly integrate data sharing, discovery and analysis into a system that addresses the whole data lifecycle, i.e. sharing, storing, managing, discovering, analyzing and reusing (data and/or metadata), bridging the gap between the data provider and the data consumer. DataGEMS is a next-generation data discovery and management ecosystem that engulfs different types of data (structured, unstructured, real-time and historical) and enables users to (a) enrich data through powerful data profiling mechanisms (b) seamlessly discover and analyze data across and within datasets using user-intuitive discovery and analysis mechanisms, such as using natural language and patterns, and (c) effectively explore and combine data with the help of stepwise guidance mechanisms during dataset discovery and analysis. The effective and efficient functioning of these mechansims will be powered by a data and model management layer that decouples data management at the low level from the data analytics at the higher level. DataGEMS is informed by and will be initially tested and deployed to promote data FAIRness and benefit diverse user communities and types of users on core domains: education, meteorology, and language data infrastructures.
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
- ciencias naturalesinformática y ciencias de la informaciónciencia de datos
- ciencias naturalesciencias de la tierra y ciencias ambientales conexasciencias de la atmósferameteorología
- ciencias naturalesciencias biológicasecologíaecosistemas
Para utilizar esta función, debe iniciar sesión o registrarse
Palabras clave
Programa(s)
Régimen de financiación
HORIZON-RIA - HORIZON Research and Innovation ActionsCoordinador
151 25 Maroussi
Grecia