Semantics-Based Machine Translation

Informations projet

SEBAMAT

N° de convention de subvention: 844951

DOI

10.3030/844951

Projet clôturé

Date de signature de la CE 24 Avril 2019

Date de début 1 Avril 2020

Date de fin 31 Mars 2022

Financé au titre de

EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions

Coût total

€ 165 085,44

Contribution de l’UE

€ 165 085,44

165 085,44

Coordonné par

ATHINA-EREVNITIKO KENTRO KAINOTOMIAS STIS TECHNOLOGIES TIS PLIROFORIAS, TON EPIKOINONION KAI TIS GNOSIS
Greece

Description du projet

La traduction automatique fondée sur la sémantique

Les systèmes de traduction automatique pourraient s’avérer une alternative rentable aux traducteurs humains dans plusieurs situations, mais les systèmes actuels comportent d’importantes lacunes. Certains prennent partiellement en compte la sémantique, d’autres tendent à se concentrer sur la fluidité du texte traduit plutôt que sur l’adéquation de la lecture. Le projet SEBAMAT, financé par l’UE, vise à fournir une méthode de traduction de pointe tenant compte du sens des mots plutôt que seulement les mots. Le projet s’efforce également d’utiliser l’étiquetage des rôles pour identifier les rôles sémantiques des mots au sein d’une phrase.

Objectif

"Most current machine translation systems are either rule-based or corpus-based. They typically take the semantics of a text only in so far into account as they are implicit in the underlying text corpora or dictionaries. This is also true for the recent neural machine translation systems, which - in comparison to standard phrase-based systems, tend to have the focus even more on fluency rather than adequacy. However, it has been pointed out that it is unlikely to be able to bring machine translation quality to the next level as long as the systems do not make better use of semantic knowledge. For example, according to Kevin Knight future machine translation systems should use information of the type ""who is doing what to whom and when"", i.e. involving the identification of the semantic roles of the items occurring in a sentence. To move forward in this direction, we propose to implement and evaluate three different approaches: The first approach is based on state of the art machine translation but considers word senses rather than words. That is, a word sense disambiguation system is used to identify the word senses in large parallel text corpora. Then, in analogy to standard word alignment, the word senses are aligned across languages, and the resulting multilingual sense dictionaries are used in conjunction with the word sense disambiguation systems for translating new texts. Our second approach uses role labeling for identifying the semantic roles of the words in a sentence. The roles are aligned across languages, and this information is then used to improve the translation process. The third approach is based on an algorithm which computes the semantic similarity between phrases. It considers the translation task as finding semantically similar phrases across languages.
"

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Ce projet n'a pas encore été classé par EuroSciVoc.
Proposez les domaines scientifiques qui vous semblent les plus pertinents et aidez-nous à améliorer notre service de classification.

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

H2020-EU.1.3. - EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions PROGRAMME PRINCIPAL
Voir tous les projets financés dans le cadre de ce programme
H2020-EU.1.3.2. - Nurturing excellence by means of cross-border and cross-sector mobility
Voir tous les projets financés dans le cadre de ce programme

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

MSCA-IF-2018 - Individual Fellowships
Voir tous les projets financés dans ce domaine

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

MSCA-IF - Marie Skłodowska-Curie Individual Fellowships (IF)

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) H2020-MSCA-IF-2018

Voir tous les projets financés au titre de cet appel

Coordinateur

ATHINA-EREVNITIKO KENTRO KAINOTOMIAS STIS TECHNOLOGIES TIS PLIROFORIAS, TON EPIKOINONION KAI TIS GNOSIS

Contribution nette de l'UE

€ 165 085,44

Adresse

ARTEMIDOS 6 KAI EPIDAVROU
151 25 MAROUSSI
Grèce

Région

Αττική Aττική Βόρειος Τομέας Αθηνών

Type d’activité

Research Organisations

Liens

Contacter l’organisation

Site web

Participation aux programmes de R&I de l'UE

Réseau de collaboration HORIZON

Coût total

€ 165 085,44

Description du projet

La traduction automatique fondée sur la sémantique

Objectif

Champ scientifique (EuroSciVoc) CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Mots‑clés Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s) Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s) Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

Coordinateur

Télécharger Télécharger le contenu de la page

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.