Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch de
CORDIS - Forschungsergebnisse der EU
CORDIS
Inhalt archiviert am 2024-06-25

Applications of the theory of rough paths to speech recognition

Ziel

We propose a novel approach to speech recognition, using new tools from stochastic analysis (the theory of rough paths) and machine learning theory (diffusion maps).

The goals of this research are:
(i) to develop new algorithms for speech recognition,
(ii) t o advance our understanding of the mathematical tools to be used for this purpose and
(iii) through this research, to create the conditions for the smooth re-integration of the researcher in the European mathematical community.

We model the speech recognition process as a multi-scale dynamical system. The lowest scale consists of the acoustic signal and its delays driving a distribution on the set of phonemes, which in turn drives a distribution on the set of words and so on.

We are mainly interested in the lowest scale. According to the theory of rough paths, all the information should be contained in the first p iterated integrals, where p is the "roughness" of the signal. The first problem is how to estimate p from a discrete sample of the signal. One way is to look at the rate of decay of the iterated integrals. Another way is to treat the signal as a discrete signal and look for the q for which p-variation becomes "negligible". By considering the first p iterated integrals, we have embedded the signal in a much bigger space. Note though that we are only interested in a particular response, namely the distribution on the phonemes. We need to find those components that contain this information.

To do this, we use a database of speech signals for which this response is known. Using a metric on the responses, we define a "kernel on similarity" on the samples, which we use to construct the diffusion map. These can be extended to all speech signals and be used to define a distance compatible with the known responses. The above methodology can be generalized to any case where we need to find those characteristics of a rough signal that cause a particular type of response.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

FP6-2004-MOBILITY-12
Andere Projekte für diesen Aufruf anzeigen

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

IRG - Marie Curie actions-International re-integration grants

Koordinator

UNIVERSITY OF WARWICK
EU-Beitrag
Keine Daten
Adresse
University House, Kirby Corner Road
COVENTRY
Vereinigtes Königreich

Auf der Karte ansehen

Links
Gesamtkosten

Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.

Keine Daten
Mein Booklet 0 0