Skip to main content

Web Graph: Learning Models for Prediction and Evolution Monitoring

Article Category

Article available in the folowing languages:

Das Web entwirren

Mit der Explosion der Informationen, die ihren Ursprung im Internet haben, gibt es einen ständig wachsenden Bedarf an Methoden, die den Nutzern noch schneller und genauer jene Informationen verschaffen, die sie auch wollen und brauchen. Eine EU-finanzierte Initiative konnte innovative Fortschritte bei Datenerhebungstechniken für den Einsatz bei Suchen im Internet, für soziale Netzwerke und zum Data Mining für das automatisierte Webmarketing und für andere Einsatzzwecke verzeichnen.

Digitale Wirtschaft

Das Lempem-Projekt ("Web graph: learning models for prediction and evolution monitoring") wurde konzipiert, um bessere Methoden zur Vorhersage von Rangfolgen einer Webseite, zur Beurteilung von Verbindungen und Wechselwirkungen zwischen Informationsgemeinschaften (soziale Netzwerke, Zitate, etc.) und zur Automatisierung von PPC-Internetwerbekampagnen (Pay-per-Click) zu entwickeln. Bei der Durchführung einer webbasierten Suche nach Informationen wird man mit einer riesigen Liste dazu passender Seiten konfrontiert, deren Rangfolge mit der am besten passenden Seite beginnt. Natürlich ist die beste Übereinstimmung laut Suchmaschine nicht immer die beste Übereinstimmung für den Nutzer. Folglich sind bessere Möglichkeiten zur Vorhersage von Rangfolgen der Schlüssel zu einer effizienten Nutzung des Internets. Das Lempem-Projekt entwickelte einen neuartigen Weg der Nutzung älterer Rankings zur Vorhersage der Ranking-Position einer Webseite auf Basis einer Kombination aus Polynomregression, EM-Clustering (Expectation-Maximisation) und einem neuen, für das Projekt entwickelten Ähnlichkeitsmaß. Die gestellten Prognosen waren recht genau und robust, wie sich in realen Tests mit großen Datenmengen ergab. Die Betrachtung von Zwischenverbindungen und der Kohäsion zwischen sogenannten Community-Subgraphen ist wichtig, um unter anderem die Zweckmäßigkeit von Plattformen zur sozialen Vernetzung und Zitatdatenbanken weiterzuentwickeln. Das Lempem-Projekt setzte k-Kernalgorithmen ein, um die kooperative Natur der Gemeinschaften zu bewerten, wohinter sich ein wichtiges Konzept verbirgt, das durch herkömmliche Community-Bewertungsmaßnahmen nicht angesprochen wird. Die k-Core-Algorithmen ergaben sehr interessante Ergebnisse, wenn die DBLP-Datenbank (Digital Bibliography & Library Project) zur Anwendung kam. Unternehmen und Forschungsinstitute verausgaben Jahr für Jahr ziemlich viel Zeit und Geld für gezielte Marketing- und Werbekampagnen, die auf Webpräferenzen basieren. Dem Lempem-Projekt gelang die Entwicklung eines Prototyps der halb- und vollautomatischen Erstellung und Verwaltung von PPC-Kampagnen, der für eine deutliche Kostenreduzierung und potenzielle Erhöhung der Wettbewerbsfähigkeit kleiner und mittlerer Unternehmen (KMU) sorgen wird, denen die Mittel fehlen, Spezialisten für Werbung einzustellen. Insgesamt erzielte das Lempem-Projekt innovative Fortschritte in Hinsicht auf die effiziente Nutzung internetbasierter Informationssammlungen. Das Lempem-Projekt konnte in seiner weitreichenden Bedeutung angesichts der überwältigenden Informationsmenge und der scheinbar unzähligen Verbindungen zwischen den verschiedenen Webseiten dafür sorgen, die Informationen für den einzelnen Nutzer und Unternehmen gleichermaßen in brauchbarerer Weise anzubieten.

Entdecken Sie Artikel in demselben Anwendungsbereich

Wissenschaftliche Fortschritte
Digitale Wirtschaft

29 August 2019

Wissenschaftliche Fortschritte
Digitale Wirtschaft

25 November 2022