Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Contenido archivado el 2024-05-30

Rapid Cross-Lingual Speaker Adaptation for Statistical Text-to-Speech Systems

Objetivo

Unit selection has been the dominant approach to text-to-speech synthesis (TTS) in the last decade. Recently, statistical TTS (STS) is proposed where statistical models are used for speech synthesis. The high quality and intelligibility speech it generates, the flexibility it offers in voice/speaker/emotion conversion, and its small memory requirements make STS systems a strong candidate to be the dominant TTS technology in the next decade. One of the most exciting research directions in the STS field is speaker adaptation where the goal is to adapt the voice characteristics to a target speaker. Maximum a posteriori and maximum likelihood linear regression methods are two of the common approaches for adaptation. There is also a recent and growing interest in cross-lingual speaker adaptation using the STS approach where the goal is to use speaker adaptation techniques to generate speech with a speaker’s voice characteristics in a target language that the speaker does not speak. Globalization and the need to communicate in multiple languages in social, economic, and political interactions increase the importance of the problem. In this proposal, a novel rapid adaptation approach is proposed for the cross-lingual speaker adaptation problem using the eigenvoice adaptation technique with the STS systems. In the proposed approach, two sets of eigenvoices are produced, one for the target language and one for the source language. Then, a regression function is generated between the source and target eigenvoice weights. Given a speaker, eigenvoice weights for the source eigenvoices are computed using a novel, perceptually-motivated objective function, and then the regression function is used to estimate the target eigenvoice weights which are then used to synthesize speech in the target language. The proposed system is expected to be the first high-performance cross-lingual speaker adaptation method for STS that can work with 5-10 seconds of adaptation data.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

FP7-PEOPLE-2010-RG
Consulte otros proyectos de esta convocatoria

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

MC-IRG - International Re-integration Grants (IRG)

Coordinador

OZYEGIN UNIVERSITESI
Aportación de la UE
€ 100 000,00
Dirección
NISANTEPE MAH ORMAN SOK 34 36
34794 Alemdag Cekmekoy, Istanbul
Turquía

Ver en el mapa

Región
İstanbul İstanbul İstanbul
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

Sin datos
Mi folleto 0 0