Un filo conduttore nella matassa del Web
Il progetto Lempem ("Web graph: learning models for prediction and evolution monitoring") era finalizzato allo sviluppo di metodi migliori per predire il ranking di una pagina Web per la valutazione delle connessioni e delle interazioni tra le community informatiche (social network, citazioni ecc.) e per le campagne pubblicitarie pay-per-clic (PPC) sul Web. Quando si effettua una ricerca di dati sul Web, si ottiene un elenco enorme di pagine corrispondenti alla ricerca, secondo un ranking che tiene conto della pertinenza all'oggetto della ricerca; è ovvio che le migliori corrispondenze scelte dal motore di ricerca spesso non corrispondono a quelle utili per l'utente, per cui un utilizzo efficiente del Web richiede nuovi metodi per predire il ranking. Con il progetto Lempem è stato sviluppato un nuovo metodo per utilizzare i ranking precedenti per predire la posizione in classifica di una pagina Web in base a una combinazione di regressione polinomiale, clustering di speranza-massimizzazione e una nuova misura di somiglianza sviluppata per il progetto; nella sperimentazione con dataset reali a larga scala, le predizioni prodotte si sono rivelate abbastanza accurate e solide. La ricerca di interconnessioni e di coesione tra i c.d. sottografi community è importante, tra l'altro per il progresso dell'utilità delle piattaforme di social network e dei database di citazioni. Con il progetto Lempem sono stati applicati algoritmi k-core per valutare la natura collaborativa delle community, un importante concetto che non è stato considerato nelle tradizionali misure di valutazione delle community. Gli algoritmi k-core hanno prodotto risultati abbastanza interessanti quando sono stati applicati al database DBLP (Digital Bibliography & Library Project). Ogni anno, le società e gli istituti di ricerca dedicano parecchio tempo e denaro al marketing mirato e alle campagne pubblicitarie basate sulle preferenze Web; con il progetto Lempem si è riusciti a produrre un prototipo di creazione e gestione delle campagne PPC semiautomatizzato e totalmente automatizzato, con un notevole risparmio sui costi e un potenziale aumento della competitività delle piccole e medie imprese prive dei fondi necessari per assumere consulenti specializzati. Riepilogando, il progetto Lempem ha prodotto notevoli progressi sull'uso efficiente delle raccolte di dati basati sul Web; data l'enorme quantità di informazioni e le innumerevoli connessioni tra le varie pagine Web, il progetto Lempem ha sottolineato l'importanza di rendere le informazioni più utili ai singoli utenti e alle aziende.