Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Integrating morpho-phonology in speech recognition

Descripción del proyecto

Enseñar a las máquinas a predecir términos en discursos continuos

La actual tecnología de reconocimiento automático de la voz (RAV) depende de representaciones acústicas con abundantes términos y de una extensa formación sobre un vasto corpus de discursos grabados a fin de permitir el reconocimiento de sonidos del habla en toda su variación junto con una secuenciación probabilística de términos completos en un modelo de lenguaje entrenado con un gran corpus de texto escrito. Por el contrario, el proyecto financiado con fondos europeos MorSR, que se basa en el reconocimiento FlexSR de componentes básicos fonológicos, permitirá a los sistemas rechazar términos improbables aprovechando la información lingüística sobre la estructura de términos, como los procesos sistemáticos y específicos del lenguaje que alteran las particulares manifestaciones de sonidos del del habla en las fronteras entre los términos. Esto mejorará el rendimiento del RAV y la adaptabilidad de los sistemas a los lenguajes en que la disponibilidad de los datos de formación resulta escasa.

Objetivo

Automatic Speech Recognition (ASR) is considered to represent the most natural man-machine interface across the spectrum of technological space. Current commercial ASR systems rely on a ‘rich’ representation of an acoustic signal for words and their variants, resulting in major challenges in the deployment of ASR systems in areas where it could have substantial social impact. Our central goal is to translate research results from the ERC funded project MORPHON into a novel ASR system to remove such barriers. We have previously demonstrated that the use of a universal set of phonological features delivers an isolated word recognition system (FlexSR) with enhanced phoneme recognition accuracy. It is more robust under conditions of non-standard speech, dialect variation and can be easily adapted to new languages. These aspects are problematic for current ASR systems which rely on the probabilistic sequencing of whole words in their language model (LM) based on large written text corpora for training. Obtaining sufficient training data for a new LM is prohibitively expensive. Instead, MorSR will incorporate linguistic information about word-structure to reject improbable words. This reduces the search space and increases the probability of identifying correct words. A major outcome will be an innovative LM based on linguistic principles. Unlike existing approaches, it is based on speech data to capture crucial regularities that are lost in text corpora. Combined with FlexSR's key strengths in identifying subtle phonological contrasts, MorSR will not only enable improved predictions of word sequences in running speech, but also dramatically reduce the requirement for training data when adapting the system to a new language. MorSR's strengths include: (a) prediction of fine-grained possibilities of word sequences based on grammatical principles; (b) requiring considerably less training data; (c) easily adaptable to new languages; and (d) will be fast, secure and accurate.

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

ERC-POC - Proof of Concept Grant

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) ERC-2018-PoC

Ver todos los proyectos financiados en el marco de esta convocatoria

Institución de acogida

THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 149 919,00
Dirección
WELLINGTON SQUARE UNIVERSITY OFFICES
OX1 2JD Oxford
Reino Unido

Ver en el mapa

Región
South East (England) Berkshire, Buckinghamshire and Oxfordshire Oxfordshire
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

€ 149 919,00

Beneficiarios (1)

Mi folleto 0 0