Buscando el mundo en bibliotecas digitales
Uno de los problemas a los que se enfrentan los usuarios cuando buscan un archivo multimedia o un documento determinado en las bibliotecas digitales es que los archivos se suelen clasificar y describir de manera diferente, a menudo utilizando el formato de la marca registrada. El proyecto MIND ha tratado de abordar este problema, y ha obtenido dos soluciones que facilitarán la búsqueda y el hallazgo de los recursos deseados. La primera técnica consiste en generar automáticamente un descriptor estándar para imágenes, extrayendo las características principales y almacenándolas como metadatos en un formato estándar. En otras palabras, se genera una descripción normalizada para conservarla junto al propio archivo, que puede estar en cualquier formato. Con ayuda de un descriptor de recursos - incluidas las características y propiedades visuales - para las imágenes de cada biblioteca, se puede realizar una búsqueda fiable en varios archivos al mismo tiempo. En segundo lugar, cuando una búsqueda realizada en diferentes archivos produce varios documentos, imágenes u otros tipos de contenido multimedia, el proyecto dispone de un sistema desarrollado para la “normalización” de las clasificaciones concedidas a cada recurso obtenido en función de su importancia. Un proceso de dos fases analiza en primer lugar los resultados de la búsqueda en cada biblioteca por separado. El sistema "aprende" el factor por el cual debe ajustar la nota otorgada a los documentos para indicar su relación con la pregunta de la búsqueda. En la segunda fase el factor correcto de cada archivo ajusta las notas, lo que permite la "fusión de datos", o la fusión de los resultados de la búsqueda de varias bibliotecas obtenidos con una sola pregunta. Los diferentes documentos e imágenes se muestran entonces en el orden correcto de importancia, al margen de archivo del que procedan, y la tarea de revisar los resultados de la búsqueda resulta por tanto mucho más fácil para el usuario.