Die Welt in digitalen Bibliotheken nachschlagen
Wenn Nutzer in digitalen Bibliotheken nach bestimmten Dokumenten oder Multimediainhalten suchen, haben sie meist das Problem, dass unterschiedliche Archive Ihre Sammlungen auf verschiedene Art und Weise klassifizieren und beschreiben und dabei eigene Formate verwenden. Mit dem MIND-Projekt haben sich Forscher diesem Problem gewidmet und zwei Lösungen entwickelt, die das Suchen und Finden der gewünschten Ressourcen erleichtern. Beim ersten Verfahren wird automatisch ein Standard-Deskriptor für Bilder erzeugt, indem Erkennungsmerkmale herausgefiltert und als Metadaten im Standardformat gespeichert werden. Anders ausgedrückt bedeutet das, dass eine standardisierte Beschreibung generiert wird, die neben dem Archiv selbst exisitiert und in einem beliebigen Format aus einer Vielzahl verschiedener Formate gespeichert ist. Durch die Verwendung eines allgemeinen Ressourcendeskriptors einschließlich der visuellen Eigenschaften und Merkmale für die Bilder in jeder Bibliothek kann eine zuverlässige Suche in verschiedenen Archiven gleichzeitig durchgeführt werden. Für den Fall, dass die Suche in verschiedenen Bibliotheken eine Vielzahl von Dokumenten, Bildern oder anderen Arten von Multimediainhalten ergibt, haben die Forscher des Projekts ein System für die "Normalisierung" der Punktzahlen entwickelt, welche die Eignung jedes einzelnen Suchergebnisses verdeutlichen. Während eines zweistufigen Prozesses werden zunächst die Suchergebnisse für jede Bibliothek getrennt analysiert. Das System "lernt", mit welchem Faktor es die Punktzahl anpassen muss, die an Dokumente verteilt wird, um deren Übereinstimmung mit der Suchanfrage zu kennzeichnen. Im zweiten Schritt werden dann für jedes Archiv die Anpassungspunktzahlen durch den korrekten Faktor angeglichen. Dies erlaubt die "Datenfusion" bzw. die Zusammenführung der Suchergebnisse aus verschiedenen Archiven, die für eine einzige Suchanfrage ausgegeben werden. Die verschiedenen Dokumente und Bilder werden dann in der Reihenfolge ihrer Wichtigkeit angezeigt und das unabhängig davon, aus welchen Archiv sie stammen. Dadurch wird es für den Nutzer erheblich leichter, die Suchergebnisse zu betrachten.