Descrizione del progetto
Risolvere la questione della provenienza dei grafi di conoscenza
Nell’era digitale, i grafi di conoscenza (KG, Knowledge Graphs) organizzano grandi quantità di informazioni, fondamentali per varie applicazioni come la diagnosi di malattie e la scoperta di farmaci. Tuttavia, l’affidabilità delle conoscenze di tali grafi che provengono principalmente da testi, rappresenta una sfida. La verifica dell’origine di questa conoscenza, nota come provenienza, è essenziale ma difficile. Con il sostegno del programma di azioni Marie Skłodowska-Curie, il progetto KG-PROVENANCE mira a sviluppare modelli efficienti per individuare e convalidare le origini della conoscenza dei grafi di conoscenza. In particolare, si affronterà la necessità critica di modelli efficienti di rilevamento della loro provenienza. Affrontando i problemi di scalabilità attraverso metodi innovativi di sottocampionamento e sviluppando un’architettura dinamica per allineare i cambiamenti di conoscenza nel testo con gli aggiornamenti dei grafi di conoscenza, il progetto promette soluzioni rivoluzionarie.
Obiettivo
Knowledge Graphs (KGs) play a vital role in modern computer systems by organizing information efficiently through structured relations between concepts or entities. They provide a structured framework for storing and retrieving information, facilitating easier navigation and analysis of large volumes of data. This is crucial in interdisciplinary knowledge-intensive applications like disease diagnosis, drug discovery, ecological data interpretation, and specialized search engines. The knowledge in KGs is predominantly derived from unstructured textual sources, such as scientific articles and news feeds. However, verifying the origin of KG knowledge in these textual sources, known as the provenance of KG knowledge, is currently challenging. Provenance detection is essential for explaining and validating the knowledge stored in KGs and identifying potential inconsistencies with textual sources. To address the lack of efficient KG provenance detection models, my method will tackle two major scientific challenges. Firstly, dealing with a large volume of text as a source of information requires significant computational power, which poses a scalability problem. To overcome this, I will design subsampling methods to focus only on the most relevant textual passages that represent the knowledge in a KG. Secondly, the scalability problem is further complicated by the dynamic and evolving nature of knowledge, with millions of new textual sources appearing daily. This presents a challenge in efficiently identifying textual sources that contribute to knowledge shifts and using them as provenance to define KG updates. To address this, I will develop a novel scalable architecture to efficiently align knowledge shifts in text to concrete changes in KGs. Finally, I will closely collaborate with interdisciplinary industrial researchers to demonstrate the effectiveness of the developed methodology in real-world scenarios.
Programma(i)
- HORIZON.1.2 - Marie Skłodowska-Curie Actions (MSCA) Main Programme
Invito a presentare proposte
(si apre in una nuova finestra) HORIZON-MSCA-2023-PF-01
Vedi altri progetti per questo bandoMeccanismo di finanziamento
HORIZON-TMA-MSCA-PF-EF - HORIZON TMA MSCA Postdoctoral Fellowships - European FellowshipsCoordinatore
8000 Aarhus C
Danimarca