Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS

Integrating morpho-phonology in speech recognition

Projektbeschreibung

Maschinen die Vorhersage von Wörtern in fortlaufender Sprache lehren

Die aktuelle Technologie zur automatischen Spracherkennung beruht auf einer reichen akustischen Darstellung von Wörtern und einem umfassenden Training mit großen Korpora, die aufgezeichnete Sprache enthalten, um die Erkennung von Sprachlauten in all ihrer Varianz in Kombination mit einer probabilistischen Sequenzierung ganzer Wörter in einem Sprachmodell zu ermöglichen, das mit großen schriftlichen Textkorpora trainiert wurde. Im Gegensatz dazu wird das EU-finanzierte Projekt MorSR die Systeme aufbauend auf der FlexSR-Erkennung phonologischer Bausteine dazu befähigen, unwahrscheinliche Wörter abzulehnen, indem sprachliche Informationen über die Wortstruktur genutzt werden, wie z. B. die systematischen, sprachspezifischen Prozesse, welche die Erscheinungsformen bestimmter Sprachlaute an den Grenzen zwischen Wörtern verändern. Dadurch soll sowohl die Leistung der automatischen Spracherkennung als auch die Anpassungsfähigkeit der Systeme an Sprachen verbessert werden, für die vergleichsweise nur wenig Trainingsdaten zur Verfügung stehen.

Ziel

Automatic Speech Recognition (ASR) is considered to represent the most natural man-machine interface across the spectrum of technological space. Current commercial ASR systems rely on a ‘rich’ representation of an acoustic signal for words and their variants, resulting in major challenges in the deployment of ASR systems in areas where it could have substantial social impact. Our central goal is to translate research results from the ERC funded project MORPHON into a novel ASR system to remove such barriers. We have previously demonstrated that the use of a universal set of phonological features delivers an isolated word recognition system (FlexSR) with enhanced phoneme recognition accuracy. It is more robust under conditions of non-standard speech, dialect variation and can be easily adapted to new languages. These aspects are problematic for current ASR systems which rely on the probabilistic sequencing of whole words in their language model (LM) based on large written text corpora for training. Obtaining sufficient training data for a new LM is prohibitively expensive. Instead, MorSR will incorporate linguistic information about word-structure to reject improbable words. This reduces the search space and increases the probability of identifying correct words. A major outcome will be an innovative LM based on linguistic principles. Unlike existing approaches, it is based on speech data to capture crucial regularities that are lost in text corpora. Combined with FlexSR's key strengths in identifying subtle phonological contrasts, MorSR will not only enable improved predictions of word sequences in running speech, but also dramatically reduce the requirement for training data when adapting the system to a new language. MorSR's strengths include: (a) prediction of fine-grained possibilities of word sequences based on grammatical principles; (b) requiring considerably less training data; (c) easily adaptable to new languages; and (d) will be fast, secure and accurate.

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

ERC-POC - Proof of Concept Grant

Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

(öffnet in neuem Fenster) ERC-2018-PoC

Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigen

Gastgebende Einrichtung

THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD
Netto-EU-Beitrag

Finanzieller Nettobeitrag der EU. Der Geldbetrag, den der Beteiligte erhält, abzüglich des EU-Beitrags an mit ihm verbundene Dritte. Berücksichtigt die Aufteilung des EU-Finanzbeitrags zwischen den direkten Begünstigten des Projekts und anderen Arten von Beteiligten, wie z. B. Dritten.

€ 149 919,00
Adresse
WELLINGTON SQUARE UNIVERSITY OFFICES
OX1 2JD Oxford
Vereinigtes Königreich

Auf der Karte ansehen

Region
South East (England) Berkshire, Buckinghamshire and Oxfordshire Oxfordshire
Aktivitätstyp
Higher or Secondary Education Establishments
Links
Gesamtkosten

Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.

€ 149 919,00

Begünstigte (1)

Mein Booklet 0 0