Objectif
WordNet is a lexical database of English where words are grouped into sets of synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations. WordNet has turned out to be an indispensable resource in the processing of natural language, and based on its model similar lexical databases were created for many other languages.
However, constructing such databases takes many years of work and is very costly. On the other hand, methods for the automatic identification of semantically related words based on large text corpora have reached a considerable degree of maturity, with the results coming close to native speakers’ performance. The proposed project aims at further refining and extending these approaches, thereby making it possible to fully automatically generate a resource similar to WordNet. The developed system will be largely language independent and is to be applied to four European languages, namely English, French, German, and Spanish. The resulting databases will be made freely available on the internet.
This is an outline of the proposed methodology: Starting from a part-of-speech tagged corpus, various methods for computing related words, such as syntax-based or utilizing latent semantic analysis, are applied and the results are systematically compared. The quality is evaluated by comparing the simulation results to a recently published data set comprising the 200,000 human similarity judgments from the Princeton Evocation project, rather than to the well established but inadequate 80 item TOEFL dataset. To identify synsets, an algorithm for unsupervised word sense induction is applied, and each word in the vocabulary is assigned to one or (if ambiguous) several of the synsets. Finally, to determine the relations between words (e.g. synonymy, hyponymy, holonymy, meronymy), an adapted version of Peter Turney’s approach for computing relational similarities is developed and applied.
Champ scientifique (EuroSciVoc)
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.
- sciences naturelles informatique et science de l'information internet
- sciences naturelles informatique et science de l'information bases de données
Vous devez vous identifier ou vous inscrire pour utiliser cette fonction
Nous sommes désolés... Une erreur inattendue s’est produite.
Vous devez être authentifié. Votre session a peut-être expiré.
Merci pour votre retour d'information. Vous recevrez bientôt un courriel confirmant la soumission. Si vous avez choisi d'être informé de l'état de la déclaration, vous serez également contacté lorsque celui-ci évoluera.
Programme(s)
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Thème(s)
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Appel à propositions
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
FP7-PEOPLE-2010-IEF
Voir d’autres projets de cet appel
Régime de financement
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Coordinateur
13284 Marseille
France
Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.