Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Contenido archivado el 2024-06-18

Sharing AudioVisual language resources for Automatic Subtitling

Descripción del proyecto


SME initiative on Digital Content and Languages

Due to recently approved European and National directives and laws, the subtitling demand has grown fast in the past few years throughout Europe. The path of manual subtitling is no longer feasible, due to the quantity of the demand and the cost of the process, both in terms of time and personnel. As a result, broadcasters and subtitling companies are seeking for subtitling alternatives more productive than the traditional manual process. Large Vocabulary Continuous Speech Recognition (LVCSR) is proving to be a useful technology for such a purpose. Respeaking – a technique in which a professional listens to the source audio and re-speaks it to a speech recognition engine which transcribes it – is consolidating as the main subtitling technique employed for live and pre-recorded broadcast productions. Another trend in use today is the application of speech recognition to automatically generate a transcript of a programme's soundtrack without the need of a respeaker, and to use this as the basis of subtitles. Unfortunately, the high cost associated to the collection and annotation of the speech and text corpora required to train each LVCSR system for respeaking and/or automatic transcription has hindered the development of new languages and application domains. However, in order to comply with the new audiovisual legal framework, European broadcasters and subtitling companies are generating speech and text corpora suitable for LVCSR developments on a daily basis. SAVAS aims to acquire, share and reuse audiovisual resources of broadcasters and subtitling companies so that high-tech European ASR companies can use the shared data to develop domain specific LVCSRs and/or LVCSRs in new languages to solve the automated subtitling needs of the media industry. Within the project, data and LVCSR technology for automated subtitling will be collected, shared and developed for the following six languages: Basque, Spanish, Italian, French, German and Portuguese.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

FP7-ICT-2011-SME-DCL
Consulte otros proyectos de esta convocatoria

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

CP - Collaborative project (generic)

Coordinador

FUNDACION CENTRO DE TECNOLOGIAS DE INTERACCION VISUAL Y COMUNICACIONES VICOMTECH
Aportación de la UE
€ 444 801,00
Dirección
PASEO MIKELETEGI PARQUE TECNOLOGICO DE MIRAMON 57
20009 Donostia San Sebastian
España

Ver en el mapa

Región
Noreste País Vasco Gipuzkoa
Tipo de actividad
Research Organisations
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

Sin datos

Participantes (7)

Mi folleto 0 0