Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-06-18

Heterogeneous Learning for Natural Language Processing

Objectif

A major challenge in machine learning and artificial intelligence is to reduce the dependency in full direct supervision and learn from various undirected resources as well. Most successful machine-learning systems require some amount of human supervision. Currently, a dominant paradigm for building a statistical parser, for example, is to first have human annotators to manually parse a large amount of sentences, and then use the parsed sentences to learn the parameters of the parsing system. For example, a parser built using the Penn Tree Bank, a large corpora of parsed sentences from the Wall Street Journal, is expected to parse well newswire text fragments, but not e-mails, which are different in nature. Yet, one would like to employ all data available from various resources, genres and types to build either a general system or a system that is adapted to a particular task. The goal of the proposed project is to design new paradigms for large-scale learning of natural language problems in various languages from heterogeneous data sources of variable size, quality, amount of supervision and type. Our primary objective is to develop theory, design algorithms, analyze them and build systems for processing written and spoken natural language. Furthermore, the world-wide-web and similar available resources contain a huge amount of heterogeneous collections of data. I propose to make use of the heterogeneous data and based on the tools I will develop to build statistical-based automated systems for various natural language processing tasks, with applications ranging from automatic document classification, via a full range of information extractions to speech analysis and recognition.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

FP7-PEOPLE-2009-RG
Voir d’autres projets de cet appel

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

MC-IRG - International Re-integration Grants (IRG)

Coordinateur

TECHNION - ISRAEL INSTITUTE OF TECHNOLOGY
Contribution de l’UE
€ 100 000,00
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

Aucune donnée
Mon livret 0 0