Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

A ground-breaking Expressive Text-To-Speech platform to create emotionally resonant virtual voices

Descripción del proyecto

Hacer que el habla generada por las máquinas suene humana

¿Qué ocurre cuando los actores de voz no están disponibles o son demasiado caros? Una solución es el habla generada por máquinas. Sin embargo, las técnicas actuales de conversión de texto a voz (TTS, por sus siglas en inglés) suenan poco naturales y con poca emoción. No pueden competir con las voces humanas. En el proyecto financiado con fondos europeos ETTS, se desarrollará un nuevo tipo de plataforma de TTS expresiva para «dar voz a los que no la tienen». Con el impulso de los algoritmos de aprendizaje profundo, el equipo del proyecto está creando voces virtuales similares a las humanas, emocionalmente resonantes, mediante un proceso rentable y que ahorra tiempo. Esta nueva «voz como servicio» está orientada a los sectores del juego, el entretenimiento, el aprendizaje electrónico y la publicidad. En última instancia, se facilitará una plataforma con múltiples voces y treinta y dos emociones en dieciséis idiomas.

Objetivo

Traditional voice production process by voice actors in a studio environment is expensive, time consuming and difficult to adapt to multiple languages. Text to speech (TTS) solutions available in the market are trying to overcome the bottlenecks in the traditional voice production pipeline, but fail to deliver the same level of emotion and prosody of human voices. To overcome these problems, Voiseed designed a ground-breaking Expressive TTS platform, driven by proprietary deep learning algorithms, to create virtual human-like voices, emotionally resonant, through a cost-efficient and time-saving process. Voiseed will offer Voice as a Service so that entertainment, e-learning and advertising companies will be enabled to generate and dub virtual voices into any target language, keeping the required prosody. During the project, Voiseed aims to develop a high quality unique expressive speech data set to release on the market a platform with more than 32 emotions in 16 languages.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.

Para utilizar esta función, debe iniciar sesión o registrarse

Coordinador

VOISEED SRL
Aportación neta de la UEn
€ 2 072 266,00
Dirección
VIA VINCENZO MONTI 7
20123 Milano
Italia

Ver en el mapa

Pyme

Organización definida por ella misma como pequeña y mediana empresa (pyme) en el momento de la firma del acuerdo de subvención.

Región
Nord-Ovest Lombardia Milano
Tipo de actividad
Private for-profit entities (excluding Higher or Secondary Education Establishments)
Enlaces
Coste total
€ 2 960 380,15