Démêlage du Web
Le projet Lempem («Web graph: learning models for prediction and evolution monitoring») a été mis en place pour développer de meilleures méthodes capables de prévoir le classement d'une page Web, d'évaluer les connexions et les interactions parmi les communautés d'informations (réseaux sociaux, citations, etc.) et d'automatiser les campagnes publicitaires en ligne axées sur le paiement au clic (PAC). Lors d'une recherche d'informations en ligne, les résultats consistent en une liste sans fin de pages classées par ordre croissant selon la meilleure correspondance. Bien entendu, la meilleure correspondance selon le moteur de recherche utilisé n'est pas forcément la meilleure correspondance aux yeux de l'utilisateur. Par conséquent, la clé d'une utilisation efficace d'Internet réside dans la mise en œuvre de meilleurs moyens de prévoir le classement des pages. Le projet Lempem a développé un nouveau moyen d'utiliser les anciens classements pour prévoir le classement d'une page Web sur la base d'une combinaison d'une régression polynomiale, d'une agrégation espérance-maximisation (EM) et d'une nouvelle mesure de similarité développée pour le projet. Les prévisions obtenues ont été relativement précises et polyvalentes une fois testées sur de vrais ensembles de données à grande échelle. La recherche au niveau des interconnexions et de la cohésion parmi les sous-graphes dits communautaires est importante pour faire avancer l'utilité, entre autres, des plateformes de réseaux sociaux et des bases de données de citations. Le projet Lempem à appliqué des algorithmes de noyau k pour évaluer la nature collaborative des communautés, un concept important non abordé par les mesures d'évaluation classiques des communautés. Les algorithmes de noyau k ont abouti à des résultats relativement intéressants une fois appliqués à la base de données DBLP (Digital Bibliography & Library Project). Chaque année, les entreprises et les instituts de recherche consacrent beaucoup de temps et d'argent à des campagnes marketing et publicitaires ciblées axées sur les préférences des internautes. Le projet Lempem a réussi à produire un prototype de création et de gestion semi- et totalement automatisées de campagnes axées sur le PAC, se traduisant par une réduction significative des coûts et une augmentation potentielle de la compétitivité des petites et moyennes entreprises (PME) qui disposent de peu de moyens financiers pour recruter des spécialises publicitaires. En définitive, le projet Lempem est à l'origine d'avancées innovantes en ce qui concerne l'utilisation efficace de collections d'informations en ligne. Compte tenu de la grande quantité d'informations et du nombre apparemment incalculable de connexions aux diverses pages Web, le projet Lempem est d'une importance notable, car grâce à lui les informations à la disposition des utilisateurs, mais aussi des entreprises, sont devenues plus utiles.