eStage eröffnet neue Möglichkeiten zum Data Mining
Mit dem sinnbildlichen Begriff "Web-Spider" bezeichnet man Tools, die das Internet nach bestimmten vom Benutzer gesuchten Daten durchkämmen. Diese Programme, auch "Web-Crawler" genannt, suchen die Vielzahl der Server im Internet nach dort gespeicherten Informationen ab und indizieren die dabei gefundenen Ergebnisse. Nachteilig ist allerdings, dass sie alle gefundenen Seiten indizieren, die das Schlüsselwort enthalten und die Suchkriterien erfüllen, und zwar unabhängig von der Relevanz der Information. Anders ausgedrückt, verfügen sie über keine hierarchische Struktur begrifflicher Zusammenhänge. So kosten das Verfolgen solcher Links nicht selten mehr Zeit als es der Suche dienlich ist, da der Benutzer nun alle Seiten nach den gewünschten Daten durchsehen muss. Zwar haben verschiedene moderne Suchmaschinen in dieser Hinsicht schon einige Verbesserungen erfahren, doch die meisten liefern noch immer eine Fülle von Treffern, die wenig oder auch überhaupt nichts mit dem recherchierten Thema zu tun haben. Mit eStage hat die deutsche Firma LemonLabs jetzt eine Suchmaschine entwickelt, die sich deutlich von der Konkurrenz abhebt. Damit kann der Benutzer ausschließlich anhand von hierarchisch strukturierten Begriffen oder Ausdrücken navigieren, die nach Kategorien wie z.B. Produktionen, Attributen und Persönlichkeiten gruppiert werden können. Gibt man beispielsweise als Suchkriterium den Begriff "Brille" ein, so können daraus Suchstrategien wie "Brillenherstellung", "Brillenmode" oder sogar "die Geschichte der Brille" erzeugt werden. Dieses spezielle System, nach dem eStage Treffer liefert, wird als "Vector-voting-Verfahren" bezeichnet. Bei der Analyse etwa eines Textdokuments zählt eStage die Häufigkeit, mit der ein Wort in einem Dokument auftaucht, und erzeugt daraus einen Indexeintrag. Erscheint beispielsweise das Wort "Herstellung" ein halbes Dutzend Mal, so wird das betreffende Dokument als relevanter für das Suchkriterium "Brillenherstellung" eingestuft als für das Suchkriterium "Brillenmode". Dieses Gruppieren von Daten bietet den Vorteil, dass Informationen anhand leicht erkennbarer Informationsräume sortiert werden, wodurch die von herkömmlichen Suchmaschinen gelieferten Mehrdeutigkeiten beseitigt werden. Dies bedeutet zugleich, dass der Benutzer niemals den semantischen Kontext verliert oder auf Daten stößt, die zu einem völlig anderen Kontext gehören. Während traditionelle Suchmaschinen Hunderte, wenn nicht Tausende von Treffern liefern können, präsentiert eStage dem Benutzer nur einige wenige, präzise ausgewählte Dokumente, die im Zusammenhang mit der gesuchten Information wesentlich sachdienlicher sind. Dies rationalisiert das gesamte Data-Mining insofern, als eine Abfrage eine Suche auslöst, die auch auf verwandten Konzepten basiert. Traditionelle Suchmaschinen bringen dem Benutzer sämtliche Web-Inhalte - eStage dagegen nur die relevanten. Sie können testen, wie die neuen Einrichtungen für das Data-Mining und die Informationswiedergewinnung in der Praxis funktionieren. Besuchen Sie das Informationsportal des "Europäischen Puppenspiels" unter www.epuppetry.com als interessantes Beispiel für die eStage-Technologie.