Robust End-To-End SPEAKER recognition based on deep learning and attention models

Projektinformationen

ETE SPEAKER

ID Finanzhilfevereinbarung: 843627

DOI

10.3030/843627

Projekt abgeschlossen

EK-Unterschriftsdatum 12 April 2019

Startdatum 1 Juni 2019

Enddatum 31 Januar 2021

Finanziert unter

EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions

Gesamtkosten

€ 120 817,20

EU-Beitrag

€ 120 817,20

120 817,20

Koordiniert durch

VYSOKE UCENI TECHNICKE V BRNE
Czechia

Projektbeschreibung

Eine Technologie zur optimierten Sprechererkennung

Die Spracherkennung ist für eine breite Palette an Anwendungen von zentraler Bedeutung. Die stetigen Weiterentwicklungen im Bereich der Datenauswertungs- und Analyseverfahren bieten Lösungen für kontinuierliche Verbesserungen in der Sprachverarbeitungsbranche. Das EU-finanzierte Projekt ETE SPEAKER zielt auf die Entwicklung eines innovativen Instruments ab, das auf der automatisierten Sprechererkennung beruht und die notwendigen Informationen isoliert, die zur Feststellung der Identität von Sprechenden in einer Sprachaufnahme notwendig sind. ETE SPEAKER wird sich auf eine umfassende Untersuchung und Ausnutzung des Potenzials tiefer neuronaler Netzwerke konzentrieren, um die sprecherspezifischen Informationen von den anderen Störvariablen zu trennen. Das Hauptziel besteht in der Einführung einer durchgängigen Lösung zur Sprecheraerkennung, die den neuesten Normen der Sprechererkennungsprüfung entsprechen.

Ziel

This project focuses on automatic speaker recognition (SID), the task of determining the identity of the speaker in a speech recording. Disentangling the speaker specific information from the rest of nuisance variability requires complex models. Deep neural networks (DNNs) have recently showed their potential for this, as the popular x-vector learnt by a DNN.
Here, we aim for end-to-end SID where the system is optimized as a whole for the target task. Despite several attempts in this line of research, many aspects still remain unexplored or not explored thoroughly.
We also propose to explore recurrent approaches, suitable for dealing with temporal signals, as well as different pooling methods to obtain a fixed-length representation from a variable length input sequence of speech features.
Next, we want to explore different flavors of attention mechanisms, which make the DNN to focus on relevant parts of the input, providing a way to quantify how much evidence has been collected about the speaker identity and the uncertainty of the obtained representation, which is a critical issue when making (Bayesian) decisions in SID.
Finally, some other approaches such as using the raw signal (instead of features) or other advances that might arise will be also explored for SID and related tasks.
To achieve our goals, we will start from theory, implement the proposed approaches and test on public SID benchmarks such as NIST SREs. The outcomes are intended to benefit both scientific community and speech processing industry.
The applicant Dr. Alicia Lozano-Diez is an excellent female researcher, who has done her Ph.D. at Audias (Universidad Autonoma de Madrid, Spain), a respected research lab. The host group Speech@FIT from Brno University of Technology (Czechia) has a top-class track on speech processing research. Thus, we expect the combination of both the researcher and the host to boost the researcher career and benefit the host group (and its industrial European partners).

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

H2020-EU.1.3. - EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions HAUPTPROGRAMM
Alle im Rahmen dieses Programms finanzierten Projekte anzeigen
H2020-EU.1.3.2. - Nurturing excellence by means of cross-border and cross-sector mobility
Alle im Rahmen dieses Programms finanzierten Projekte anzeigen

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

MSCA-IF-2018 - Individual Fellowships
Alle im Rahmen dieses Themas finanzierten Projekte anzeigen

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

MSCA-IF-EF-ST - Standard EF

Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

(öffnet in neuem Fenster) H2020-MSCA-IF-2018

Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigen

Koordinator

VYSOKE UCENI TECHNICKE V BRNE

Netto-EU-Beitrag

€ 120 817,20

Adresse

ANTONINSKA 548/1
602 00 BRNO STRED
Tschechien

Region

Česko Jihovýchod Jihomoravský kraj

Aktivitätstyp

Higher or Secondary Education Establishments

Links

Die Organisation kontaktieren

Website

Teilnahme an EU-FuI-Programmen

HORIZON-Kooperationsnetzwerk

Gesamtkosten

€ 120 817,20

Projektbeschreibung

Eine Technologie zur optimierten Sprechererkennung

Ziel

Wissenschaftliches Gebiet (EuroSciVoc) CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Programm/Programme Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Aufforderung zur Vorschlagseinreichung Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

Koordinator

Herunterladen Den Inhalt der Seite herunterladen

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.