Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-06-18

Analysis of Natural Language for Real World Applications

Objectif

Natural language understanding, information extraction, and machine translation are critical for human-machine interaction and key technologies in many everyday applications (e.g. search engines, mobile devices, robots). Natural language understanding systems transform spoken language or written texts into syntactic and semantic structures. Critically, these systems need to be able to work flexibly on many different text genres.
A critical challenge for current syntactic analyzers in real-world applications is to adapt flexibly to different language domains. This problem arises because current syntactic analyzers are trained primarily on syntactically annotated newspaper texts. In particular, the major syntactic resource for training syntactic analyzers in English is an annotated text collection called the Penn-Tree Bank. The Penn-Tree Bank contains texts from only one genre that is economic news. However, the syntactic analyzers are applied to a wide range of text genres such as emails, newsgroups, blogs, consumer reviews, newspapers with mostly non-economic text, spoken language etc. When applied to these texts the error rate doubles. As a result of a doubled error rate the syntactic analyzer assigns the wrong syntactic structures to the input sentences. In other words, it confuses the subject and object in a sentence. Therefore it is no longer able to answer the critical questions in natural language understanding: Who does what to whom and why and when. For real-world applications this means that the robot may fail to understand the instructions or commands posed by the customer.

The aim of this proposal is to reduce this gap and to provide techniques that obtain a higher accuracy and allow the adaptation to out-of domain genres in an easy and economically acceptable way. Further, in an interdisciplinary and innovative fashion, we will combine syntactic analysis with related analysis techniques from the field of speech recognition.

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

FP7-PEOPLE-2013-CIG
Voir d’autres projets de cet appel

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

MC-CIG - Support for training and career development of researcher (CIG)

Coordinateur

THE UNIVERSITY OF BIRMINGHAM
Contribution de l’UE
€ 100 000,00
Adresse
Edgbaston
B15 2TT Birmingham
Royaume-Uni

Voir sur la carte

Région
West Midlands (England) West Midlands Birmingham
Type d’activité
Higher or Secondary Education Establishments
Liens
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

Aucune donnée
Mon livret 0 0