Multilingual Lexicon Extraction from Comparable Corpora

Informazioni relative al progetto

MULTILEX

ID dell’accordo di sovvenzione: 631829

Progetto chiuso

Data di avvio 1 Settembre 2014

Data di completamento 28 Dicembre 2018

Finanziato da

Specific programme "People" implementing the Seventh Framework Programme of the European Community for research, technological development and demonstration activities (2007 to 2013)

Costo totale

€ 100 000,00

Contributo UE

€ 100 000,00

100 000,00

Coordinato da

JOHANNES GUTENBERG-UNIVERSITAT MAINZ
Germany

Obiettivo

Given large collections of parallel (i.e. translated) texts, it is well-known how to, by successively applying a sentence- and a
word-alignment step, establish correspondences between words across languages. However, parallel texts are a scarce
resource for most language pairs involving lesser-used languages. On the other hand, human second language acquisition
seems not to require the reception of large amounts of translated texts, which indicates that there must be another way of
crossing the language barrier. Apparently, the human capabilities are based on looking at comparable resources, i.e. texts
or speech on related topics in different languages, which, however, are not translations of each other. Comparable (written
or spoken) corpora are far more common than parallel corpora, thus offering the chance to overcome the data acquisition
bottleneck. Despite its cognitive motivation, in the proposed project we will not attempt to simulate the complexities of
human second language acquisition, but will show that it is possible by purely technical means to automatically extract
information on word- and multiword-translations from comparable corpora. The aim is to push the boundaries of current
approaches, which typically utilize correlations between co-occurrence patterns across languages, in several ways: 1)
Eliminating the need for initial lexicons by using a bootstrapping approach which only requires a few seed translations. 2)
Implementing a new methodology which first establishes alignments between comparable documents across languages,
and then computes cross-lingual alignments between words and multiword-units. 3) Improving the quality of computed word
translations by applying an interlingua approach, which, by relying on several pivot languages, allows a highly effective
multi-dimensional cross-check. 4) We will show that, by looking at foreign citations, language translations can even be
derived from a single monolingual text corpus.

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

scienze sociali psicologia psicolinguistica

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

FP7-PEOPLE - Specific programme "People" implementing the Seventh Framework Programme of the European Community for research, technological development and demonstration activities (2007 to 2013)

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

FP7-PEOPLE-2013-CIG - Marie-Curie Action: "Career Integration Grants"

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

FP7-PEOPLE-2013-CIG
Vedi altri progetti per questo bando

Meccanismo di finanziamento

Meccanismo di finanziamento (o «Tipo di azione») all’interno di un programma con caratteristiche comuni. Specifica: l’ambito di ciò che viene finanziato; il tasso di rimborso; i criteri di valutazione specifici per qualificarsi per il finanziamento; l’uso di forme semplificate di costi come gli importi forfettari.

MC-CIG - Support for training and career development of researcher (CIG)

Coordinatore

JOHANNES GUTENBERG-UNIVERSITAT MAINZ

Contributo UE

€ 100 000,00

Indirizzo

SAARSTRASSE 21
55122 Mainz
Germania

Regione

Rheinland-Pfalz Rheinhessen-Pfalz Mainz, Kreisfreie Stadt

Tipo di attività

Higher or Secondary Education Establishments

Collegamenti

Contatta l’organizzazione

Sito web

Partecipazione a programmi di R&I dell'UE

Rete di collaborazione HORIZON

Costo totale

Nessun dato

Obiettivo

Campo scientifico (EuroSciVoc) CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Programma(i) Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i) Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Invito a presentare proposte Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

Coordinatore

Scarica Scarica il contenuto della pagina

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.