Skip to main content

Web Graph: Learning Models for Prediction and Evolution Monitoring

Article Category

Article available in the folowing languages:

Desentrañar la Web

Dado el crecimiento explosivo de la cantidad de información servida mediante Web, existe una necesidad cada vez más acuciante de contar con métodos que contribuyan con mayor precisión y rapidez a obtener la información necesaria. Una iniciativa financiada con fondos europeos ha generado progresos innovadores en técnicas de recuperación de datos para su empleo en búsquedas Web, redes sociales y minería de datos y que, por ejemplo, se pueden aplicar a la publicidad en este medio.

Economía digital

El proyecto Lempem («Grafos Web: modelos que aprenden para labores de predicción y control de la evolución») se creó para desarrollar métodos mejores de predicción de la clasificación de una página Web, evaluar las conexiones e interacciones entre comunidades de información (redes sociales, citas, etc.) y campañas de publicidad web basadas en el pago por tráfico (pay-per-click, PPC). Al llevar a cabo una búsqueda de información en la Web, los resultados se presentan en forma de una lista enorme de páginas clasificadas según un orden decreciente de importancia. Por supuesto, dicha importancia otorgada por el motor de búsqueda puede o no coincidir con el criterio del usuario. Por lo tanto, dar con mejores maneras de predecir las clasificaciones es clave para la utilización eficiente de la Web. El proyecto Lempem desarrolló un método innovador de aprovechar clasificaciones anteriores para predecir la posición de una página web en función de una combinación de regresión polinomial, agrupación mediante expectativa-maximización (EM) y una nueva forma de medir la similitud. Las predicciones producidas por el proyecto fueron bastante precisas y sólidas al comprobarse en corpus de datos a gran escala y obtenidos de situaciones reales. El estudio de las interconexiones y de la cohesión entre subgrafos de comunidades posee importancia para aumentar la utilidad de las plataformas sociales y las bases de datos de citas, entre otras aplicaciones. El proyecto Lempem utilizó algoritmos K-core para evaluar la naturaleza colaborativa de las comunidades, un concepto importante que no se ha tratado en las medidas de evaluación de comunidades convencionales. Los algoritmos K-core produjeron resultados interesantes al ejecutarse sobre la base de datos DBLP (Digital Bibliography & Library Project). Empresas y centros de investigación dedican una buena cantidad de su tiempo y recursos anuales a campañas de publicidad basadas en preferencias Web. El proyecto Lempem logró producir un prototipo tanto semiautomático como completamente automático de creación y gestión de campañas PPC que permite reducir considerablemente los costes y podría aumentar la competitividad de PYME que carezcan de los fondos necesario para contratar a especialistas en publicidad. En resumen, el proyecto Lempem produjo resultados innovadores relacionados con el empleo eficiente de compilaciones de información basadas en Web. El proyecto Lempem cobra una importancia enorme de cara a aumentar la utilidad de la información para empresas y particulares, sobre todo a la luz de la abrumadora cantidad de información y la en apariencia incontable cantidad de conexiones que existen entre las distintas páginas Web.

Descubra otros artículos del mismo campo de aplicación