Descripción del proyecto
Planteamientos innovadores ante la limitación de recursos para la consulta de grandes grafos
El nivel de respuesta a las consultas o preguntas (esto es, la capacidad de extraer información sobre los datos almacenados en una base de datos o de actuar sobre ellos) constituye la base de muchas de las aplicaciones modernas actuales, como las redes sociales, los chatbots y los motores de búsqueda de internet. La base de datos es un grafo de conocimiento en el que los nodos representan puntos de datos y las aristas corresponden a las «conexiones» que existen entre ellos. Aunque la posibilidad de realizar consultas simultáneas de varias bases de datos mejorará las capacidades de estos recursos, todavía se necesita encontrar nuevos métodos al respecto. A partir de esta premisa, el equipo del proyecto GRACE, financiado por el Consejo Europeo de Investigación, pretende desarrollar un innovador lenguaje de consulta para patrones de grafos, una teoría revisada de la complejidad computacional y una formalización de la escalabilidad paralela basada en el aumento del número de procesadores. De este modo, cuando los flamantes algoritmos se muestren incapaces de proporcionar respuestas exactas a las consultas, recurrirán a esquemas de aproximación que les permitan encontrar un equilibrio entre precisión y coste.
Objetivo
When we search for a product, can we find, using a single query, top choices ranked by Google and at the same time, recommended by our friends connected on Facebook? Is such a query tractable on the social graph of Facebook, which has over 1.31 billion nodes and 170 billion links? Is it feasible to evaluate such a query if we have bounded resources such as time and computing facilities? These questions are challenging: they demand a departure from the traditional query evaluation paradigm and from the classical computational complexity theory, and call for new resource-constrained methodologies to query big graphs.
This project aims to tackle precisely these challenges, from fundamental problems to practical techniques, using radically new approaches. We will develop a graph pattern query language that allows us to, e.g. unify Web search (via keywords) and social search (via graph patterns), and express graph pattern association rules for social media marketing. We will revise the conventional complexity theory to characterize the tractability of queries on big data, and formalize parallel scalability with the increase of processors. We will also develop algorithmic foundations and resource-constrained techniques for querying big graphs, by ``making big data small''. When exact answers are beyond reach in big graphs, we will develop data-driven and query-driven approximation schemes to strike a balance between the accuracy and cost. As a proof of the theory, we will develop GRACE, a system to answer graph pattern queries on big GRAphs within bounded resourCEs, based on the techniques developed. We envisage that the project will deliver methodological foundations and practical techniques for querying big graphs in general, and for improving search engines and social media marketing in particular. A breakthrough in this subject will advance several fields, including databases, theory of computation, parallel computation and social data analysis.
Ámbito científico
- natural sciencescomputer and information sciencesdata sciencebig data
- natural sciencescomputer and information sciencesartificial intelligencecomputer vision
- natural sciencesmathematicspure mathematicsdiscrete mathematicsgraph theory
- natural sciencescomputer and information sciencesinternetworld wide web
- natural sciencescomputer and information sciencesdatabasesrelational databases
Palabras clave
Programa(s)
Régimen de financiación
ERC-ADG - Advanced GrantInstitución de acogida
EH8 9YL Edinburgh
Reino Unido