Robust End-To-End SPEAKER recognition based on deep learning and attention models

Información del proyecto

ETE SPEAKER

Identificador del acuerdo de subvención: 843627

DOI

10.3030/843627

Proyecto cerrado

Fecha de la firma de la CE 12 Abril 2019

Fecha de inicio 1 Junio 2019

Fecha de finalización 31 Enero 2021

Financiado con arreglo a

EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions

Coste total

€ 120 817,20

Aportación de la UE

€ 120 817,20

120 817,20

Coordinado por

VYSOKE UCENI TECHNICKE V BRNE
Czechia

Descripción del proyecto

Una tecnología optimizada para el reconocimiento automático del locutor

El reconocimiento de voz es fundamental en una amplia gama de aplicaciones. El creciente desarrollo de las técnicas de análisis y explotación de datos ofrece innovaciones para la mejora continua de la industria del procesamiento de voz. El proyecto ETE SPEAKER, financiado con fondos europeos, se propone desarrollar una herramienta innovadora basada en el reconocimiento automático del locutor (RAL) que aísla la información necesaria para determinar la identidad del locutor en una grabación de voz. ETE SPEAKER se centrará en investigar y utilizar plenamente el potencial de las redes neuronales profundas para desentrañar la información propia del locutor del resto de la variabilidad molesta. Su objetivo principal es la introducción del RAL de extremo a extremo conforme a las últimas normas de evaluación de reconocimiento del locutor.

Objetivo

This project focuses on automatic speaker recognition (SID), the task of determining the identity of the speaker in a speech recording. Disentangling the speaker specific information from the rest of nuisance variability requires complex models. Deep neural networks (DNNs) have recently showed their potential for this, as the popular x-vector learnt by a DNN.
Here, we aim for end-to-end SID where the system is optimized as a whole for the target task. Despite several attempts in this line of research, many aspects still remain unexplored or not explored thoroughly.
We also propose to explore recurrent approaches, suitable for dealing with temporal signals, as well as different pooling methods to obtain a fixed-length representation from a variable length input sequence of speech features.
Next, we want to explore different flavors of attention mechanisms, which make the DNN to focus on relevant parts of the input, providing a way to quantify how much evidence has been collected about the speaker identity and the uncertainty of the obtained representation, which is a critical issue when making (Bayesian) decisions in SID.
Finally, some other approaches such as using the raw signal (instead of features) or other advances that might arise will be also explored for SID and related tasks.
To achieve our goals, we will start from theory, implement the proposed approaches and test on public SID benchmarks such as NIST SREs. The outcomes are intended to benefit both scientific community and speech processing industry.
The applicant Dr. Alicia Lozano-Diez is an excellent female researcher, who has done her Ph.D. at Audias (Universidad Autonoma de Madrid, Spain), a respected research lab. The host group Speech@FIT from Brno University of Technology (Czechia) has a top-class track on speech processing research. Thus, we expect the combination of both the researcher and the host to boost the researcher career and benefit the host group (and its industrial European partners).

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

H2020-EU.1.3. - EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions PROGRAMA PRINCIPAL
Ver todos los proyectos financiados en el marco de este programa
H2020-EU.1.3.2. - Nurturing excellence by means of cross-border and cross-sector mobility
Ver todos los proyectos financiados en el marco de este programa

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

MSCA-IF-2018 - Individual Fellowships
Ver todos los proyectos financiados en el marco de este tema

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

MSCA-IF-EF-ST - Standard EF

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) H2020-MSCA-IF-2018

Ver todos los proyectos financiados en el marco de esta convocatoria

Coordinador

VYSOKE UCENI TECHNICKE V BRNE

Aportación neta de la UEn

€ 120 817,20

Dirección

ANTONINSKA 548/1
602 00 BRNO STRED
Chequia

Región

Česko Jihovýchod Jihomoravský kraj

Tipo de actividad

Higher or Secondary Education Establishments

Enlaces

Contactar con la organización

Sitio web

Participación en los programas de I+D de la UE

Red de colaboración de HORIZON

Coste total

€ 120 817,20

Descripción del proyecto

Una tecnología optimizada para el reconocimiento automático del locutor

Objetivo

Ámbito científico (EuroSciVoc) CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Programa(s) Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s) Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

Coordinador

Descargar Descargar el contenido de la página

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.