Descripción del proyecto
Conexión de consultas basadas en ejemplos y métodos de inteligencia empresarial
La nube Linked Open Data (LOD) es un diagrama de conocimiento que muestra conjuntos de datos de acceso libre vinculados. Alberga una cantidad enorme de información, por lo que se necesitan tecnologías de extracción de información y estadística empresarial para obtener información valiosa. Con todo, el empleo del lenguaje de consulta especializado de las pasarelas representa un gran reto para usuarios no expertos. Esto, a su vez, constituye un obstáculo para sacarle el máximo partido a LOD. El proyecto EDAO, financiado con fondos europeos, se propone respaldar el análisis de la LOD mediante el desarrollo de un innovador sistema de exploración de datos que permitirá a los usuarios extraer información de conjuntos de datos complejos y desconocidos. El objetivo del proyecto es emplear operadores de inteligencia empresarial habilitados por el paradigma de consulta por ejemplos para el procesamiento analítico exploratorio en línea y evaluar un nuevo sistema de exploración basado en ejemplos.
Objetivo
Linked Open Data (LOD) is a standard methodology especially adopted to implement Knowledge Graphs, i.e. networks of facts where entities are connected by predicates describing relationships among them (via RDF triples). LOD are adopted in many domains, and an enormous set of information is currently shared by the private and the public sector in this form (e.g. on the EU Open Data Portal). Therefore, the LOD cloud contains a very rich corpora of information that requires dedicated business analytics and information extractions technologies for the extraction of valuable insights. Yet, to access this data and perform such analysis, the typical gateway are specialized query languages (e.g. SPARQL) that are usually challenging to use to non-expert users. This constitutes a major impediment in their successful exploitation. To support advanced LOD analytics we propose a novel data exploration system which allows users to extract insights within complex and unfamiliar datasets. We plan to implement dedicated Business Intelligence (BI) operators enabled by the Exemplar Query paradigm for Exploratory Online Analytical Processing (OLAP). Example-based methods have proven to be extremely valuable since they avoid complex query languages by using examples to represent the required information. Yet, they have never been studied in the OLAP/BI context. Therefore, we propose to study a new Example-Driven Exploration system to bridge the gap between example-based queries and BI methods. The researcher has co-authored the first paper on Exemplar Queries for graphs. Moreover, the supervisor, prof. Torben Bach Pedersen at Aalborg University, is an expert on BI/OLAP methods for web and semi-structured data. The host of the secondment, prof. Ioana Manolescu, at INRIA Saclay, is expert in advanced RDF analytics operators. These high-profile collaborations will ensure both the successful outcome of the project as well as a platform for the development of the researcher’s career.
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
- ciencias naturalesinformática y ciencias de la informacióningeniería del conocimiento
- ciencias naturalesinformática y ciencias de la informaciónciencia de datosinteligencia empresarial
Para utilizar esta función, debe iniciar sesión o registrarse
Programa(s)
Régimen de financiación
MSCA-IF-EF-ST - Standard EFCoordinador
9220 Aalborg
Dinamarca