Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano it
CORDIS - Risultati della ricerca dell’UE
CORDIS
Contenuto archiviato il 2022-12-23

MULTILINGUAL TEXT TOOLS AND CORPORA FOR CENTRAL AND EASTERN EUROPEAN LANGUAGES

Obiettivo



The development of resources, tools, and standards is widely developed for EU languages, there have been very few comparable efforts for the languages of Central and Eastern Europe (CEE). MULTEXT EAST is intended to fill this gap by developing CEE languages and adapting the already existing tools EU standards.

Multext-East is a an extention of the REE DG XIII/E research programme on language ingineering project Multext, one of the largest EU projects in the domain of language tools and resources. Multext has three main objectives:
standardisation: development of a software standard based on a 'software Lego' approach for corpus handling tools, together with TEI-based encoding conventions specifically suited to multilingual corpora and language engineering applications.
tool and corpus development: development of an extensive set of tools for corpus annotation and exploitation as well as the first annotated large-scale multilingual corpus for EU languages, intended to serve as a reference and test-bed for multilingual tools and applications.
industrial validation: integration by six major European companies of project results into high-level NLP applications such as term extraction and machine translation lexicon generation, thus providing a first indication of downstream applicability.

Multext-East will extend the scope of Multext by transferring its expertise, methodologies, and tools to CEE countries. Because projects funded under Copernicus will begin at approximately Multext's mid point, its tools and methods will be well-developed enough to extend to additional languages. At the same time, the timing will enable Multext to incorporate feedback from application of its tools to vastly different language types (especially Slavic and Finno-Ugric) while they are still under development.

Together, Multext and Multext-East will create a unique network of more than twenty academic research centres and companies, all developing and using common lingware and methodologies, as well as producing the first annotated large-scale multilingual corpus for 12 EU and CEE languages.

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Questo progetto non è ancora stato classificato con EuroSciVoc.
Suggerisci i campi scientifici che ritieni più rilevanti e aiutaci a migliorare il nostro servizio di classificazione.

È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Dati non disponibili

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

Dati non disponibili

Meccanismo di finanziamento

Meccanismo di finanziamento (o «Tipo di azione») all’interno di un programma con caratteristiche comuni. Specifica: l’ambito di ciò che viene finanziato; il tasso di rimborso; i criteri di valutazione specifici per qualificarsi per il finanziamento; l’uso di forme semplificate di costi come gli importi forfettari.

CSC - Cost-sharing contracts

Coordinatore

CNRS & Université de Provence
Contributo UE
Nessun dato
Indirizzo
Av. Robert Schuman 29
13621 Aix-en-Provence Cedex 1
Francia

Mostra sulla mappa

Costo totale

I costi totali sostenuti dall’organizzazione per partecipare al progetto, compresi i costi diretti e indiretti. Questo importo è un sottoinsieme del bilancio complessivo del progetto.

Nessun dato

Partecipanti (11)

Il mio fascicolo 0 0