Parcourir le monde grâce aux bibliothèques numériques
Un des problèmes rencontrés par les utilisateurs de bibliothèques numériques lors de la recherche de documents spécifiques ou de contenus multimédias est que les différentes archives ont tendance à classer et décrire leurs collections de diverses manières, en utilisant souvent des formats brevetés. Le projet MIND a tenté de résoudre ce problème en mettant au point deux solutions qui facilitent la recherche et la récupération des ressources souhaitées. La première technique consiste à générer automatiquement un descripteur d'images standard, en extrayant des caractéristiques identificatrices et en les stockant sous la forme de métadonnées dans un format standard. En d'autres termes, une description standardisée est générée en vue d'être conservée en parallèle avec l'archive elle-même, qui peut ainsi prendre de nombreux formats différents. En utilisant un descripteur de ressources standard, incluant les propriétés et caractéristiques visuelles, pour les images contenues dans chaque bibliothèque, il est possible d'effectuer une recherche fiable dans plusieurs archives à la fois. Deuxièmement, lorsqu'une recherche dans plusieurs bibliothèques renvoie un certain nombre de documents, d'images ou autres types de contenu multimédia, le projet a mis au point un système de "normalisation" des notes attribuées à chaque ressource renvoyée pour sa pertinence. Au cours d’un processus en deux étapes, le système analyse d’abord les résultats de la recherche pour chaque bibliothèque distincte. Il "apprend" en fonction de quel facteur il doit ajuster la note attribuée aux documents pour refléter leur pertinence par rapport à la recherche lancée. Dans un deuxième temps, le système ajuste les notes correspondantes en fonction du facteur approprié pour chaque archive. On obtient ainsi une "fusion des données" ou une fusion des résultats de recherche de plusieurs bibliothèques renvoyés par une demande unique. Les différents documents et images sont ensuite affichés par ordre de pertinence, quelle que soit l'archive dont ils proviennent, de sorte que la tâche de tri des résultats de la recherche par l’utilisateur est considérablement simplifiée.