Feature Stories - Suchtechnologie, die Meinungen sondieren und die Zukunft vorhersagen kann

Vor mehr als 50 Jahren hat ein indischer Bibliothekar ein System zur Kategorisierung von Büchern vorgeschlagen. Dieses System hat nun eine durch die EU finanzierte Forschungsgruppe dazu angeregt, eine neue Art der Internet-Suche zu entwickeln, bei der auch Faktoren wie Meinung, Tendenz, Kontext, Zeit und Ort berücksichtigt werden. Die neue Technologie, die bald kommerziell im Einsatz sein könnte, kann Trends der öffentlichen Meinung zu einem Thema, einem Unternehmen oder einer Person anzeigen und sie kann sogar für Zukunftsvorhersagen genutzt werden.

Digitale Wirtschaft

"Führen Sie eine Suche nach dem Begriff 'Κlima' bei Google oder anderen Suchmaschinen durch und sie erhalten im Grunde genommen eine Liste von Ergebnissen, in denen dieses Wort vorkommt: es gibt keine Kategorisierung, keine spezielle Reihenfolge, keinen Kontext. Aktuelle Suchmaschinen berücksichtigen keine Dimensionen von Vielfalt: Faktoren wie der Zeitpunkt der Veröffentlichung der Information, ob es eine Verzerrung zu der einen oder anderen Meinung gibt, die mit dem Inhalt oder der Struktur einhergehen, wer diese veröffentlicht hat und wann", erklärt Fausto Giunchiglia, Professor für Informatik an der Universität Trento in Italien. Aber können Such-Technologien so gestaltet werden, dass sie Vielfalt identifizieren und wahrnehmen können? Kann eine Suchmaschine Ihnen sagen, etwa, wie sich die öffentliche Meinung über den Klimawandel in den letzten zehn Jahren verändert hat? Oder, wie warm das Wetter in einem Jahrhundert sein wird, indem Schätzungen der Gegenwart und Vergangenheit aus verschiedenen Quellen zusammengezogen werden? Es scheint, dass sie es kann dank einer bahnbrechenden Kombination von moderner Wissenschaft und einer Jahrzehnte alten Systematik, die von europäischen Forschern im Projekt LivingKnowledge (1) zusammengeführt wurden. Die mit 4,8 Millionen EUR von der Europäischen Kommission geförderte Forschungsgruppe von LivingKnowledge wird von Prof. Giunchiglia koordiniert. Sie adoptierte einen multidisziplinären Ansatz für die Entwicklung neuer Suchtechnologien. Dabei stützten sich die Forscher auf so unterschiedliche Bereiche wie Informatik, Sozialwissenschaften, Semiotik und Bibliothekswissenschaften. Tatsächlich diente der sogenannte Vater der Bibliothekswissenschaft, Sirkali Ramamrita Ranganathan, ein indischer Bibliothekar, den Forschern als Quelle der Inspiration. In den 1920er und 1930er Jahren entwickelte Ranganathan das erste große analytisch-synthetische oder facettierte Klassifikationssystem. Mit diesem Ansatz werden den Objekten - Bücher, im Falle von Ranganathan; Web-und Datenbank-Inhalten, im Falle von LivingKnowlege - mehrere Eigenschaften und Merkmale (Facetten) zugeordnet, sodass die Klassifizierung in vielfältiger Weise erfolgen kann, anstatt nur in einer einzigen, vorgegebenen, taxonomischen Ordnung. Mit dem System könnte ein Artikel über die Auswirkungen auf die Landwirtschaft des Klimawandels in Norwegen, der im Jahr 1990 geschrieben wurde, unter "Geographie" , Klima , Klimawandel, Landwirtschaft, Forschung, Norwegen, 1990 eingeordnet werden. Um die Klassifizierung besser zu verstehen und die Suchmaschinen-Technologie zu implementieren, wandten sich die Forscher von LivingKnowledge an das Indian Statistical Institute, einem Projektpartner, der die Facettenklassifikation täglich nutzt. "Mit dem Wissen dieses Instituts konnten wir Ranganathans Pseudo-Algorithmus in einen Computer-Algorithmus umwandeln und die Informatiker waren in der Lage, diesen zu benutzen, um Daten aus dem Web zu schürfen, deren Bedeutung und Kontext zu extrahieren, diesen Facetten zuzuweisen und diese zu verwenden, um die Informationen auf der Basis der Dimensionen von Vielfalt zu strukturieren", so Prof. Basis Giunchiglia. Forscher an der Universität Pavia in Italien, einem weiteren Partner, stützten sich bei der Gewinnung von Bedeutung aus Web-Inhalten auf ihr Know-how - nicht nur aus Text- und Multimedia-Inhalten sondern aus der Art und Weise wie die Informationen strukturiert und angelegt sind - um auf Verzerrungen und Meinungen zu schließen, indem sie den Daten eine weitere Facette hinzufügten. "Wir sind imstande, die Verzerrung der Autoren zu einem bestimmten Thema zu ermitteln und ob ihre Meinungen positiv oder negativ sind ", sagt der Koordinator von LivingKnowledge. "Fakten sind Fakten, aber jede Information über ein Ereignis oder zu einem Thema ist häufig von Meinungen und Verzerrungen umgeben." Von Bibliotheken der 1930er Jahre bis zur Raumfahrt im Jahr 2034 ... Die Technologie wurde in einer Testumgebung implementiert, die ab sofort als Open Source Software erhältlich ist, und für Studien verwendet, die sich um zwei interessante Anwendungsszenarien herum drehen. In Zusammenarbeit mit dem österreichischen Sozialforschungsinstitut SORA, verwendete das Team das LivingKnowledge-System, um soziale Trends zu erkennen und die öffentliche Meinung in sowohl quantitativer als auch qualitativer Hinsicht zu überwachen. Wird es für die Medien-Content-Analyse eingesetzt, könnte das System einem Unternehmen dabei helfen, die Auswirkungen einer neuen Werbekampagne zu verstehen, indem es zeigt, wie diese die Markenbekanntheit im Laufe der Zeit beeinflusst und welche gesellschaftlichen Gruppen dafür am empfänglichsten waren. Alternativ könnte eine Regierung das System nutzen, um die öffentliche Meinung über eine neue Politik zu messen, oder ein Politiker könnte es verwenden, um auf die Forderungen eines Konkurrenten so zu reagieren, dass die Reaktion eine breite Akzeptanz in der Öffentlichkeit erhält. Das LivingKnowledge-Team hat gemeinsam mit Barcelona Media, einer gemeinnützigen Forschungsstiftung, die von Yahoo! unterstützt wird, und der in den Niederlanden ansässigen Internet-Memory Foundation nicht nur aktuelle und vergangene Trends analysiert, sondern diese extrapoliert und auf Prognosen aus vorhandenen Daten zurückgegriffen, um die Zukunft vorauszusagen. Ihre Future Predictor-Anwendung ist in der Lage, Recherchen zu Fragen wie etwa dieser zu machen: "Wie werden die Ölpreise im Jahr 2050 sein?" oder "Um wie viel werden die globalen Temperaturen in den nächsten 100 Jahren weiter steigen?" und relevante Informationen und Prognosen aus dem heutigen Web herausziehen. Zum Beispiel erhält man bei einer Suche zum Jahr 2034 den Begriff "Raumfahrt" als das relevanteste Thema, das in den heutigen Nachrichten indiziert ist. "Dieses Anwendungsszenario bietet eine Funktionalität, mit der sich Trends erkennen lassen noch bevor diese in den täglichen Ereignissen sichtbar werden - und zwar durch integrierte Such- und Navigationsfunktionen für die Suche nach unterschiedlichen, multi-dimensionalen Daten je nach Inhalt, Verzerrung und Zeit", erläutert Prof. Giunchiglia. Einige der Projektpartner planen diese Technologie kommerziell umzusetzen, und der Projektkoordinator beabsichtigt die Einrichtung einer gemeinnützigen Stiftung, um auf den Ergebnissen von LivingKnowledge zu einer Zeit aufzubauen, in der die Nachfrage nach dieser Art von Technologie wahrscheinlich zunehmen wird. Professor Giunchiglia weist darauf hin, dass Google die Welt grundlegend verändert hat, da jeder Zugang zum großen Teil der Informationen in der Welt erhält. Doch diese Suche ist nur für Menschen gedacht: derzeit kann nur der Mensch die Bedeutung all dieser Daten verstehen, und das führt zu einer Informationsflut, die sich häufig als problematisch erweist. Wie bewegen wir uns im Zeitalter der "Big Data", in dem Informationen über alles und jedes auf Knopfdruck zur Verfügung steht. Doch die Bedeutung dieser Informationen sollte nicht nur für den Menschen sondern auch für Maschinen verständlich sein, weshalb Quantität mit Qualität kombiniert werden muss. LivingKnowledge befasst sich mit diesem Problem. "Als wir das Projekt gestartet haben, hat niemand über Big Data gesprochen. Doch jetzt spricht jeder davon und das Interesse an dieser Technologie steigt", so Prof. Giunchiglia. "In der Zukunft wird sich alles um riesige Big Data drehen - wir können nicht sagen, ob das gut oder schlecht ist, aber es wird sicherlich anders sein." Mit dem Future Predictor des Projekts ist Prof. Giunchiglia gut gerüstet, um diese Vorhersage zu treffen. LivingKnowledge wurde unter dem Siebten Rahmenprogramm der Europäischen Union (RP7) gefördert. (1) "LivingKnowledge facts, opinions and bias in time" Nützliche Links: - Website von "LivingKnowledge facts, opinions and bias in time" - Projektbeschreibung von LivingKnowledge auf CORDIS

Feature Stories - Suchtechnologie, die Meinungen sondieren und die Zukunft vorhersagen kann

Diese Seite teilen

Herunterladen