Robust End-To-End SPEAKER recognition based on deep learning and attention models

Informazioni relative al progetto

ETE SPEAKER

ID dell’accordo di sovvenzione: 843627

Sito web del progetto

DOI

10.3030/843627

Progetto chiuso

Data della firma CE 12 Aprile 2019

Data di avvio 1 Giugno 2019

Data di completamento 31 Gennaio 2021

Finanziato da

EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions

Costo totale

€ 120 817,20

Contributo UE

€ 120 817,20

120 817,20

Coordinato da

VYSOKE UCENI TECHNICKE V BRNE
Czechia

Descrizione del progetto

Una tecnologia di riconoscimento automatico del parlante ottimizzata

Il riconoscimento vocale si configura come una funzione primaria per una vasta gamma di applicazioni. Il crescente sviluppo di tecniche per l’utilizzo e l’analisi di dati offre soluzioni intese a migliorare in modo continuativo l’industria dell’elaborazione vocale. Il progetto ETE SPEAKER, finanziato dall’UE, si propone di sviluppare uno strumento innovativo basato sul riconoscimento automatico del parlante che isola le informazioni necessarie a determinare l’identità di chi sta parlando durante una registrazione vocale. ETE SPEAKER concentrerà l’attenzione su uno studio e utilizzo dettagliato delle potenzialità insite nelle reti neurali profonde allo scopo di distinguere le informazioni relative al parlante dal resto della variabilità dei disturbi sonori. Il suo obiettivo è quello di introdurre una soluzione di riconoscimento automatico del parlante completa che si allinei agli ultimi standard in materia di valutazione del riconoscimento del parlante.

Obiettivo

This project focuses on automatic speaker recognition (SID), the task of determining the identity of the speaker in a speech recording. Disentangling the speaker specific information from the rest of nuisance variability requires complex models. Deep neural networks (DNNs) have recently showed their potential for this, as the popular x-vector learnt by a DNN.
Here, we aim for end-to-end SID where the system is optimized as a whole for the target task. Despite several attempts in this line of research, many aspects still remain unexplored or not explored thoroughly.
We also propose to explore recurrent approaches, suitable for dealing with temporal signals, as well as different pooling methods to obtain a fixed-length representation from a variable length input sequence of speech features.
Next, we want to explore different flavors of attention mechanisms, which make the DNN to focus on relevant parts of the input, providing a way to quantify how much evidence has been collected about the speaker identity and the uncertainty of the obtained representation, which is a critical issue when making (Bayesian) decisions in SID.
Finally, some other approaches such as using the raw signal (instead of features) or other advances that might arise will be also explored for SID and related tasks.
To achieve our goals, we will start from theory, implement the proposed approaches and test on public SID benchmarks such as NIST SREs. The outcomes are intended to benefit both scientific community and speech processing industry.
The applicant Dr. Alicia Lozano-Diez is an excellent female researcher, who has done her Ph.D. at Audias (Universidad Autonoma de Madrid, Spain), a respected research lab. The host group Speech@FIT from Brno University of Technology (Czechia) has a top-class track on speech processing research. Thus, we expect the combination of both the researcher and the host to boost the researcher career and benefit the host group (and its industrial European partners).

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

H2020-EU.1.3. - EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions PROGRAMMA PRINCIPALE
Vedi tutti i progetti finanziati nell’ambito di questo programma
H2020-EU.1.3.2. - Nurturing excellence by means of cross-border and cross-sector mobility
Vedi tutti i progetti finanziati nell’ambito di questo programma

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

MSCA-IF-2018 - Individual Fellowships
Vedi tutti i progetti finanziati su questa tematica

Meccanismo di finanziamento

Meccanismo di finanziamento (o «Tipo di azione») all’interno di un programma con caratteristiche comuni. Specifica: l’ambito di ciò che viene finanziato; il tasso di rimborso; i criteri di valutazione specifici per qualificarsi per il finanziamento; l’uso di forme semplificate di costi come gli importi forfettari.

MSCA-IF-EF-ST - Standard EF

Vedi tutti i progetti finanziati nell’ambito di questo schema di finanziamento

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

(si apre in una nuova finestra) H2020-MSCA-IF-2018

Vedi tutti i progetti finanziati nell’ambito del bando

Coordinatore

VYSOKE UCENI TECHNICKE V BRNE

Contributo netto dell'UE

€ 120 817,20

Indirizzo

ANTONINSKA 548/1
602 00 BRNO STRED
Cechia

Regione

Česko Jihovýchod Jihomoravský kraj

Tipo di attività

Higher or Secondary Education Establishments

Collegamenti

Contatta l’organizzazione Sito web

Partecipazione a programmi di R&I dell'UE

Rete di collaborazione HORIZON

Costo totale

€ 120 817,20

Descrizione del progetto

Una tecnologia di riconoscimento automatico del parlante ottimizzata

Obiettivo

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

Coordinatore

Condividi questa pagina Condividi questa pagina sui social network

Scarica Scarica il contenuto della pagina

Robust End-To-End SPEAKER recognition based on deep learning and attention models

Descrizione del progetto

Una tecnologia di riconoscimento automatico del parlante ottimizzata

Obiettivo

Campo scientifico (EuroSciVoc) CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Programma(i) Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i) Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Invito a presentare proposte Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

Coordinatore

Condividi questa pagina Condividi questa pagina sui social network

Scarica Scarica il contenuto della pagina

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.