Objectif
There are noticeable asymmetries in availability of high-quality natural language processing (NLP). We can adequately summarize English newspapers and translate them into Korean, but we cannot translate Korean newspaper articles into English, and summarizing micro-blogs is much more difficult than summarizing newspaper articles. This is a fundamental problem for modern societies, their development and democracy, as well as perhaps the most important research problem in NLP right now.
Most NLP technologies rely on highly accurate syntactic parsing. Reliable parsing models can be induced from large collections of manually annotated data, but such collections are typically limited to sampled newswire in major languages. Highly accurate parsing is therefore not available for other languages and other domains.
The NLP community is well aware of this problem, but unsupervised techniques that do not rely on manually annotated data cannot be used for real-world applications, where highly accurate parsing is needed, and sample bias correction methods that automatically correct the bias in newswire when parsing, say, micro-blogs, do not yet lead to robust improvements across the board.
The objective of this project is to develop new learning methods for parsing natural language for which no unbiased labeled data exists. In order to do so, we need to fundamentally rethink the unsupervised parsing problem, including how we evaluate unsupervised parsers, but we also need to supplement unsupervised learning techniques with robust methods for automatically correcting sample selection biases in related data. Such methods will be applicable to both cross-domain and cross-language syntactic parsing and will pave the way toward robust and scalable NLP. The societal impact of robust and scalable NLP is unforeseeable and comparable to how efficient information retrieval techniques have revolutionized modern societies.
Champ scientifique (EuroSciVoc)
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.
- sciences naturelles informatique et science de l'information science des données traitement du langage naturel
- sciences naturelles informatique et science de l'information intelligence artificielle apprentissage automatique apprentissage non supervisé
- sciences sociales science politique systèmes de gouvernement démocratie
Vous devez vous identifier ou vous inscrire pour utiliser cette fonction
Nous sommes désolés... Une erreur inattendue s’est produite.
Vous devez être authentifié. Votre session a peut-être expiré.
Merci pour votre retour d'information. Vous recevrez bientôt un courriel confirmant la soumission. Si vous avez choisi d'être informé de l'état de la déclaration, vous serez également contacté lorsque celui-ci évoluera.
Programme(s)
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Thème(s)
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Appel à propositions
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
ERC-2012-StG_20111124
Voir d’autres projets de cet appel
Régime de financement
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Institution d’accueil
1165 KOBENHAVN
Danemark
Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.