Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Scalable Knowledge-Aware Image Caption Generation

Descripción del proyecto

Herramienta de vanguardia para perfeccionar el subtitulado de imágenes

Los sistemas de subtitulado de imágenes son limitados porque dependen en gran medida del contenido visual. Esto explica por qué los subtítulos generados suelen ser sólo descriptivos y pasan por alto la información clave necesaria para entender la imagen. El objetivo del proyecto ROCAP, financiado con fondos europeos, es introducir una herramienta de subtitulado que beneficie a campos como la geografía, la radiología y la historia del arte, en los que los subtítulos deben incluir información que no puede obtenerse únicamente de las imágenes. El equipo de ROCAP estudiará la viabilidad de aplicar el método de subtitulación desarrollado en un proyecto anterior a la subtitulación de imágenes médicas e historia del arte. Mediante la colaboración con expertos en estos ámbitos, el proyecto especificará un sistema práctico de subtitulado, lo aplicará como herramienta de código abierto y lo probará en condiciones reales.

Objetivo

Image captioning is the process of mapping a visual scene to a short textual description. Automating this process is vital for many computer applications, including information retrieval from visual data, computerized assistance to visually impaired people, and automatic tour guiding. State-of-the-art captioning systems are limited by their heavy reliance on visual contents. As a result, generated captions are often purely descriptive and miss important information that is needed in order to understand the image. This PoC project develops a captioning tool that will be useful for knowledge-intensive areas like Geography, Radiology or Art History, where captions need to include information that cannot be extracted from images alone. It builds on results of the ROCKY ERC AdG project, whose innovative captioning system integrates external knowledge into the captioning process. This allowed the ROCKY project to employ standard methods of image captioning, with a deep convolutional neural network (CNN) for image understanding and a Transformer network for language generation. Thanks to the external knowledge integration, the ROCKY captioning prototype gets substantially closer to human-generated captions than standard captioning systems that do not take external knowledge into account. This PoC project will use this result by implementing a knowledge-aware captioning system that is scalable for practical purposes. The project examines the feasibility of the ROCKY captioning method for Medical Imaging and Art History and implements it for one of these domain as a use case. The project will engage with experts in these domains, specify a practical captioning system, implement it as an open-source tool and test it in realistic situations. The anticipated value of this effort is in the development of a general method that would allow one open-source platform to be multi-purpose, thereby cost-effectively adjustable to needs of different domains.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.

Para utilizar esta función, debe iniciar sesión o registrarse

Institución de acogida

UNIVERSITEIT UTRECHT
Aportación neta de la UEn
€ 150 000,00
Dirección
HEIDELBERGLAAN 8
3584 CS Utrecht
Países Bajos

Ver en el mapa

Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total
Sin datos

Beneficiarios (1)