Tracing knowledge graph provenance from textual knowledge sources

Informazioni relative al progetto

KG-PROVENANCE

ID dell’accordo di sovvenzione: 101146515

DOI

10.3030/101146515

Progetto chiuso

Data della firma CE 6 Marzo 2024

Data di avvio 1 Aprile 2024

Data di completamento 31 Marzo 2026

Finanziato da

Marie Skłodowska-Curie Actions (MSCA)

Costo totale

Nessun dato

Contributo UE

€ 230 774,40

Coordinato da

AARHUS UNIVERSITET
Denmark

Descrizione del progetto

Risolvere la questione della provenienza dei grafi di conoscenza

Nell’era digitale, i grafi di conoscenza (KG, Knowledge Graphs) organizzano grandi quantità di informazioni, fondamentali per varie applicazioni come la diagnosi di malattie e la scoperta di farmaci. Tuttavia, l’affidabilità delle conoscenze di tali grafi che provengono principalmente da testi, rappresenta una sfida. La verifica dell’origine di questa conoscenza, nota come provenienza, è essenziale ma difficile. Con il sostegno del programma di azioni Marie Skłodowska-Curie, il progetto KG-PROVENANCE mira a sviluppare modelli efficienti per individuare e convalidare le origini della conoscenza dei grafi di conoscenza. In particolare, si affronterà la necessità critica di modelli efficienti di rilevamento della loro provenienza. Affrontando i problemi di scalabilità attraverso metodi innovativi di sottocampionamento e sviluppando un’architettura dinamica per allineare i cambiamenti di conoscenza nel testo con gli aggiornamenti dei grafi di conoscenza, il progetto promette soluzioni rivoluzionarie.

Obiettivo

Knowledge Graphs (KGs) play a vital role in modern computer systems by organizing information efficiently through structured relations between concepts or entities. They provide a structured framework for storing and retrieving information, facilitating easier navigation and analysis of large volumes of data. This is crucial in interdisciplinary knowledge-intensive applications like disease diagnosis, drug discovery, ecological data interpretation, and specialized search engines. The knowledge in KGs is predominantly derived from unstructured textual sources, such as scientific articles and news feeds. However, verifying the origin of KG knowledge in these textual sources, known as the provenance of KG knowledge, is currently challenging. Provenance detection is essential for explaining and validating the knowledge stored in KGs and identifying potential inconsistencies with textual sources. To address the lack of efficient KG provenance detection models, my method will tackle two major scientific challenges. Firstly, dealing with a large volume of text as a source of information requires significant computational power, which poses a scalability problem. To overcome this, I will design subsampling methods to focus only on the most relevant textual passages that represent the knowledge in a KG. Secondly, the scalability problem is further complicated by the dynamic and evolving nature of knowledge, with millions of new textual sources appearing daily. This presents a challenge in efficiently identifying textual sources that contribute to knowledge shifts and using them as provenance to define KG updates. To address this, I will develop a novel scalable architecture to efficiently align knowledge shifts in text to concrete changes in KGs. Finally, I will closely collaborate with interdisciplinary industrial researchers to demonstrate the effectiveness of the developed methodology in real-world scenarios.

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Questo progetto non è ancora stato classificato con EuroSciVoc.
Suggerisci i campi scientifici che ritieni più rilevanti e aiutaci a migliorare il nostro servizio di classificazione.

Parole chiave

Parole chiave del progetto, indicate dal coordinatore del progetto. Da non confondere con la tassonomia EuroSciVoc (campo scientifico).

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

HORIZON.1.2 - Marie Skłodowska-Curie Actions (MSCA) PROGRAMMA PRINCIPALE
Vedi tutti i progetti finanziati nell’ambito di questo programma

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

HORIZON-MSCA-2023-PF-01-01 - MSCA Postdoctoral Fellowships 2023
Vedi tutti i progetti finanziati su questa tematica

Meccanismo di finanziamento

Meccanismo di finanziamento (o «Tipo di azione») all’interno di un programma con caratteristiche comuni. Specifica: l’ambito di ciò che viene finanziato; il tasso di rimborso; i criteri di valutazione specifici per qualificarsi per il finanziamento; l’uso di forme semplificate di costi come gli importi forfettari.

HORIZON-TMA-MSCA-PF-EF - HORIZON TMA MSCA Postdoctoral Fellowships - European Fellowships

Vedi tutti i progetti finanziati nell’ambito di questo schema di finanziamento

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

(si apre in una nuova finestra) HORIZON-MSCA-2023-PF-01

Vedi tutti i progetti finanziati nell’ambito del bando

Coordinatore

AARHUS UNIVERSITET

Contributo netto dell'UE

€ 230 774,40

Indirizzo

NORDRE RINGGADE 1
8000 Aarhus C
Danimarca

Regione

Danmark Midtjylland Østjylland

Tipo di attività

Higher or Secondary Education Establishments

Collegamenti

Contatta l’organizzazione Sito web

Partecipazione a programmi di R&I dell'UE

Rete di collaborazione HORIZON

Costo totale

Nessun dato

Partner (1)

Partner

UNIVERSITEIT VAN AMSTERDAM

Paesi Bassi

Contributo netto dell'UE

€ 0,00

Descrizione del progetto

Risolvere la questione della provenienza dei grafi di conoscenza

Obiettivo

Campo scientifico (EuroSciVoc) CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Parole chiave Parole chiave del progetto, indicate dal coordinatore del progetto. Da non confondere con la tassonomia EuroSciVoc (campo scientifico).

Programma(i) Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i) Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Invito a presentare proposte Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.