European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Saliency-aware High-resolution Video Processing

Article Category

Article available in the following languages:

Procesamiento multimedia mejorado

La prominencia visual es un término que se refiere a la importancia subjetiva que se atribuye a determinadas partes de una imagen que atrae la atención de quien la observa. La mejora de los modelos de prominencia contribuirá a representar de manera eficiente el contenido de vídeo en alta resolución al centrarse en la «atención» del procesamiento.

Economía digital icon Economía digital

La prominencia visual tiene una importancia creciente para el procesamiento informático de las imágenes y vídeos en alta resolución. Una de las limitaciones actuales que se atribuyen al vídeo en ultra alta definición es la inmensidad y la complejidad de los datos asociados. La Unión Europea respaldó el proyecto «Saliency-aware high-resolution video processing» (SHIVPRO) para resolver la acuciante necesidad de desarrollar mejores modelos de prominencia. Para hacer frente a la cuestión de las imágenes multiescala complejas, el modelo espaciotemporal del proyecto emplea características y mediciones estadísticas de prominencia basadas en regiones para modificar la prominencia dentro de una determinada escala. A continuación, propaga dicha modificación utilizando la fusión de regiones guiada por prominencia en las distintas escalas e incorporando de manera flexible información de flujo descendente. El primer paso consistió en el desarrollo de un modelo de prominencia basado en regiones que aprovechaba histogramas de similitudes de color y espacio, y dos mediciones de dichos histogramas: distintividad y compactibilidad. El siguiente fue la detección de características prominentes relevantes basadas en el modelo de prominencia. Los científicos propusieron un concepto novedoso: el árbol de prominencia. La imagen se simplifica para generar regiones primitivas cuyas mediciones de prominencia se comparan con regiones globales. El método de fusión de regiones genera el árbol donde cada nudo de hojas representa una región primitiva y cada nudo sin hojas representa una región no primitiva. Un análisis de prominencia sistemático produce un mapa de prominencia de píxeles de alta calidad. A partir de los modelos anteriores, el equipo del proyecto elaboró su modelo de prominencia espaciotemporal eficiente basado en superpíxeles. Se extrajeron histogramas de movimiento y color a partir de los datos de superpíxeles. Por otra parte, se genera un mapa de prominencia espacial de píxeles y un mapa temporal similar, y se utiliza un método de fusión adaptativa para fusionarlos. El modelo demostró una mayor eficacia en la detección de la prominencia y la predicción de la atención humana con respecto a las técnicas existentes. El equipo también analizó la cuestión emergente de la detección de coprominencia o identificación de objetos prominentes comunes en un conjunto de imágenes y propuso al respecto modelos jerárquicos de coprominencia basados en la segmentación. El importante trabajo realizado hizo avanzar la tecnología de codificación de vídeo de alta eficiencia al mejorar la eficiencia de la codificación y reducir la complejidad computacional. La capacidad de extraer características importantes desde una perspectiva subjetiva para simplificar el procesamiento de ingentes cantidades de datos para aplicaciones empresariales, domésticas y de vídeo móvil tiene una importancia socioeconómica determinante. Los científicos financiados por la Unión Europea han realizado una notable contribución con las mejoras conseguidas en los modelos y en la detección de prominencia, que han demostrado ser más eficaces que las técnicas existentes en la actualidad.

Palabras clave

Procesamiento multimedia, prominencia, alta resolución, contenido de vídeo, espaciotemporal

Descubra otros artículos del mismo campo de aplicación