Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-06-18

Cross-lingual Knowledge Extraction

Description du projet


Language Technologies

The goal of the X-LIKE project is to develop technology to monitor and aggregate knowledge that is currently spread across global mainstream and social media, and to enable cross-lingual services for publishers, media monitoring and business intelligence.In terms of research contributions, the aim is to combine scientific insights from several scientific areas to contribute in the area of cross-lingual text understanding. By combining modern computational linguistics, machine learning, text mining and semantic technologies we plan to deal with the following two key open research problems:- to extract and integrate formal knowledge from multilingual texts with cross-lingual knowledge bases, and- to adapt linguistic techniques and crowdsourcing to deal with irregularities in informal language used primarily in social media.As an interlingua, knowledge resources from Linked Open Data cloud (http://linkeddata.org/(s’ouvre dans une nouvelle fenêtre)) will be used with special focus on general common sense knowledge base CycKB (http://www.cyc.com/(s’ouvre dans une nouvelle fenêtre)). For the languages where no required linguistic resources will be available, we will use a probabilistic interlingua representation trained from a comparable corpus drawn from the Wikipedia.The solution will be applied on two case studies, both from the area of news. For the Bloomberg case study the domain will be financial news, while for the Slovenian Press Agency we will deal with general news. The technology developed in the project will be used to introduce cross-lingual and information from social media in services for publishers and end-users in the area of summarization, contextualization, personalization, and plagiarism detection. Special attention will be paid to analysing news reporting bias from multilingual sources. The developed technology will be language-agnostic, while within the project we will specifically address English, German, Spanish, and Chinese as major world languages and Catalan and Slovenian as minority languages.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

FP7-ICT-2011-7
Voir d’autres projets de cet appel

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

CP - Collaborative project (generic)

Coordinateur

INSTITUT JOZEF STEFAN
Contribution de l’UE
€ 989 487,00
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

Aucune donnée

Participants (7)

Mon livret 0 0