Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Capturing Identity, Change, and the Long Tail in Knowledge Graphs

Description du projet

Les graphes de connaissances illustrent l’évolution du discours dans le temps pour soutenir la recherche en sciences humaines

Pour tirer parti de la richesse des informations écrites et orales mises en ligne par des êtres humains, nous avons besoin de technologies linguistiques, c’est-à-dire des technologies de l’information spécialisées dans le traitement du langage humain. De nombreuses méthodes de technologie linguistique sont incapables de reconnaître et d’interpréter des entités et des concepts complexes dans leur contexte historique. Le projet TRIFECTA, financé par le Conseil européen de la recherche, souhaite remédier à cette situation en créant une base de données combinant la technologie linguistique et la technologie du web sémantique. En recourant à l’IA, à des experts du domaine et aux mégadonnées, TRIFECTA entend traiter les entités et les concepts comme de riches réseaux de connaissances (ou graphes). Il permettra aux chercheurs en sciences humaines de trouver des informations sur un sujet qui évolue au fil du temps et qui renvoie à de nombreux discours différents.

Objectif

At first blush entities and concepts such as Dutch East India Company or coffee may seem straightforward, but in fact they are complex and multifaceted. The wealth of digital sources presents the massive potential to study these notions at an unprecedented scale. However, current technologies for distant reading are not capable of dealing with this.
TRIFECTA aims to create a database that describes complex entities and concepts and their contexts by combining language and semantic web technology to extract and relate information from different texts over time. In addition, a key aim of TRIFECTA is to advance the state of the art in these technologies to deal with change over time and connections to many different narratives. Sophisticated knowledge representation methods from the semantic web can mitigate the failing that many language technology methods do not incorporate enough background knowledge to recognise and interpret complex entities and concepts in their historical contexts. By treating them as rich networks (or graphs) of knowledge that can express change and relationships to different concepts in space and time, semantic databases can handle the complexity needed to make the outputs of language technology tools suited to humanities research.
Via two use cases, I identify a set of core contentious entities and concepts in maritime and food history. Next, through a data-driven, iterative approach, I advance beyond the state-of-the-art in natural language technology for the humanities by targeting three key aspects of the recognition and modelling of complex concepts (i.e. identity, change, and the long tail). I propose a novel peer-evaluation approach in which a team of humanities scholars, computational linguists, and semantic web researchers collaborate closely to create truly hybrid artificial intelligence systems that will enable humanities research to scale to big data without losing sight of the contextual complexity.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

HORIZON-ERC - HORIZON ERC Grants

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) ERC-2022-COG

Voir tous les projets financés au titre de cet appel

Institution d’accueil

KONINKLIJKE NEDERLANDSE AKADEMIE VAN WETENSCHAPPEN - KNAW
Contribution nette de l'UE

La contribution financière nette de l’UE est la somme d’argent que le participant reçoit, déduite de la contribution de l’UE versée à son tiers lié. Elle prend en compte la répartition de la contribution financière de l’UE entre les bénéficiaires directs du projet et d’autres types de participants, tels que les participants tiers.

€ 1 998 351,00
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

€ 1 998 351,00

Bénéficiaires (1)

Mon livret 0 0