Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Integrating morpho-phonology in speech recognition

Description du projet

Apprendre aux machines à prédire les mots du discours

La technologie actuelle de reconnaissance automatique de la parole (RAP) dépend des représentations acoustiques riches des mots et d’un entraînement rigoureux sur de grands corpus de discours enregistré pour permettre la reconnaissance des sons du discours dans toutes leurs variantes, combinée à un séquençage probabiliste de mots entiers dans un modèle linguistique entraîné grâce à de grands corpus de textes écrits. Le projet MorSR, financé par l’UE, se fonde quant à lui sur la reconnaissance FlexSR des composants phonologiques et va plus loin en permettant aux systèmes de rejeter les mots improbables. Pour ce faire, il exploite des informations linguistiques sur la structure des mots, comme les processus systématiques et spécifiques à la langue qui modifient les manifestations de certains sons à la limite entre les mots. Cela améliorera à la fois les performances de la RAP et l’adaptabilité des systèmes aux langues qui présentent une disponibilité des données d’entraînement réduite.

Objectif

Automatic Speech Recognition (ASR) is considered to represent the most natural man-machine interface across the spectrum of technological space. Current commercial ASR systems rely on a ‘rich’ representation of an acoustic signal for words and their variants, resulting in major challenges in the deployment of ASR systems in areas where it could have substantial social impact. Our central goal is to translate research results from the ERC funded project MORPHON into a novel ASR system to remove such barriers. We have previously demonstrated that the use of a universal set of phonological features delivers an isolated word recognition system (FlexSR) with enhanced phoneme recognition accuracy. It is more robust under conditions of non-standard speech, dialect variation and can be easily adapted to new languages. These aspects are problematic for current ASR systems which rely on the probabilistic sequencing of whole words in their language model (LM) based on large written text corpora for training. Obtaining sufficient training data for a new LM is prohibitively expensive. Instead, MorSR will incorporate linguistic information about word-structure to reject improbable words. This reduces the search space and increases the probability of identifying correct words. A major outcome will be an innovative LM based on linguistic principles. Unlike existing approaches, it is based on speech data to capture crucial regularities that are lost in text corpora. Combined with FlexSR's key strengths in identifying subtle phonological contrasts, MorSR will not only enable improved predictions of word sequences in running speech, but also dramatically reduce the requirement for training data when adapting the system to a new language. MorSR's strengths include: (a) prediction of fine-grained possibilities of word sequences based on grammatical principles; (b) requiring considerably less training data; (c) easily adaptable to new languages; and (d) will be fast, secure and accurate.

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

ERC-POC - Proof of Concept Grant

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) ERC-2018-PoC

Voir tous les projets financés au titre de cet appel

Institution d’accueil

THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD
Contribution nette de l'UE

La contribution financière nette de l’UE est la somme d’argent que le participant reçoit, déduite de la contribution de l’UE versée à son tiers lié. Elle prend en compte la répartition de la contribution financière de l’UE entre les bénéficiaires directs du projet et d’autres types de participants, tels que les participants tiers.

€ 149 919,00
Adresse
WELLINGTON SQUARE UNIVERSITY OFFICES
OX1 2JD Oxford
Royaume-Uni

Voir sur la carte

Région
South East (England) Berkshire, Buckinghamshire and Oxfordshire Oxfordshire
Type d’activité
Higher or Secondary Education Establishments
Liens
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

€ 149 919,00

Bénéficiaires (1)

Mon livret 0 0