Reportaje - Tecnología de búsqueda capaz de sondear opiniones y predecir el futuro

Partiendo de un sistema para la catalogación de libros propuesto por un bibliotecario indio hace más de cincuenta años, un equipo de investigadores financiados con fondos de la Unión Europea ha desarrollado un nuevo tipo de búsqueda en Internet que tiene en cuenta factores tales como opinión, sesgo, contexto, tiempo y ubicación. Esta nueva tecnología, que pronto podría comercializarse, pone de relieve tendencias en la opinión pública con respecto a determinado tema, empresa o persona en el tiempo, y puede emplearse incluso para predecir el futuro.

Economía digital

«Si se busca la palabra "clima" en Google u otro buscador, básicamente se obtiene un listado de páginas donde aparece esa palabra, sin ninguna clasificación, ni orden ni contexto. Los buscadores actuales no tienen en cuenta las dimensiones de la diversidad: factores tales como cuándo se publicó la información, quién la publicó y si existe algún sesgo inherente hacia una opinión u otra en el contenido y la estructura», explicó Fausto Giunchiglia, profesor de informática de la Universidad de Trento (Italia). ¿Es posible una tecnología de búsqueda capaz de reconocer la diversidad e integrarla en sus resultados? ¿Podría un buscador, por ejemplo, informar de la evolución de la opinión pública con respecto al tema del cambio climático en la última década? ¿O, por ejemplo, proyectar cómo de caluroso será el clima dentro de un siglo a base de reunir estimaciones actuales y pasadas procedentes de distintas fuentes? Al parecer, sí es posible, gracias a una pionera combinación de ciencia moderna y un método de clasificación usado desde hace décadas, según aseguran los investigadores europeos que colaboran en el proyecto LivingKnowledge (1). El equipo de este proyecto, dotado de un presupuesto de 4,8 millones de euros por la Comisión Europea y coordinado por el profesor Giunchiglia, ha aplicado un enfoque multidisciplinario para desarrollar una nueva tecnología de búsqueda que aprovecha conocimientos de campos tan diversos como la informática, las ciencias sociales, la semiótica y la biblioteconomía. La fuente de inspiración de estos investigadores fue el llamado padre de la biblioteconomía, el bibliotecario indio Sirkali Ramamrita Ranganathan. Durante las décadas de 1920 y 1930, Ranganathan desarrolló el primer gran sistema de clasificación analítico-sintético, dividido por facetas. Conforme a este método, a los objetos (libros, en el caso de Ranganathan, y contenidos web y de bases de datos, en el caso del equipo de LivingKnowledge) se les asignan múltiples características y atributos (facetas) que hacen posible que su clasificación se ordene de distintas maneras y no siguiendo un único orden taxonómico preestablecido. Aplicando este sistema, un artículo dedicado a los efectos del cambio climático en la agricultura y redactado en Noruega en 1990 podría clasificarse por «Geografía; Clima; Cambio climático; Agricultura; Investigación; Noruega; 1990». Con el fin de comprender con mayor precisión este sistema de clasificación y aplicarlo a la tecnología de buscadores, los investigadores de LivingKnowledge acudieron al Instituto Estadístico de la India, uno de los socios de proyecto, en el que utilizan a diario esta clasificación por facetas. «Gracias a sus conocimientos, logramos convertir el pseudoalgoritmo de Ranganathan en un algoritmo informático que nuestros especialistas en informática pudieron emplear para recuperar datos de la web, extraer su significado y contexto, asignarle facetas y utilizar éstas para estructurar toda la información conforme a las dimensiones de la diversidad», explicó el profesor Giunchiglia. Investigadores de la Universidad de Pavía (Italia), otro de los socios, se valieron de sus conocimientos sobre la extracción de significados a partir de contenidos web -no sólo del texto y del contenido audiovisual, sino también de de la manera en que la información se encuentra estructurada y dispuesta- para inferir sesgos y opiniones, añadiendo así una faceta más a los datos. «Somos capaces de reconocer el sesgo de los autores con respecto a determinado tema y si sus opiniones son positivas o negativas», aseguró el coordinador de LivingKnowledge. «Los hechos son hechos, pero toda información relativa a determinado acontecimiento o cualquier tema con frecuencia viene aderezada con opiniones y sesgos.» De las bibliotecas de los años treinta a los viajes espaciales en 2034... La tecnología se implementó en un banco de pruebas, ya disponible como software de fuente abierta, y se utilizó en ensayos basados en dos atractivos ámbitos de aplicación.Encolaboración con el instituto austríaco de investigaciones sociales SORA, el equipo utilizó el sistema LivingKnowledge para reconocer tendencias sociales y observar la opinión pública tanto en términos cuantitativos como cualitativos. Si se utilizase para analizar contenidos audiovisuales, este sistema podría permitir a una empresa comprender las repercusiones de una nueva campaña publicitaria, al mostrar su influencia en el reconocimiento de la marca con el paso del tiempo y qué grupos sociales han sido más receptivos. Un organismo gubernamental también podría valerse de este sistema para sondear a la opinión pública con respecto a una nueva política, mientras que un político podría utilizarlo para responder a las afirmaciones de un candidato rival del modo más aceptable para la opinión pública. En colaboración con Barcelona Media (fundación científica sin ánimo de lucro apoyada por Yahoo!) y con la Internet Memory Foundation, con sede en Países Bajos, el equipo de LivingKnowledge no sólo examinó tendencias actuales y pasadas, sino que además las extrapoló y recopiló previsiones de los datos existentes para tratar de predecir el futuro. Su aplicación Future Predictor es capaz de realizar búsquedas a partir de consultas tales como «¿Cuál será el precio del petróleo en 2050?» o «¿Cuánto subirán las temperaturas mundiales durante los próximos cien años?» y hallar información y previsiones pertinentes entre los contenidos existentes actualmente en la web. Así, por ejemplo, una búsqueda del año 2034 depara que el tema más relevante, según los índices de las noticias actuales, son los «viajes espaciales». «En un plazo más inmediato, este ámbito de aplicación plantea funciones útiles para detectar tendencias antes incluso de que resulten evidentes en los acontecimientos diarios, gracias a las capacidades integradas de búsqueda y navegación para dar con información diversa y multidimensional en función del contenido, la orientación y el momento temporal», señaló el profesor Giunchiglia. Varias de las entidades asociadas al proyecto pretenden realizar un uso comercial de esta tecnología, mientras que su coordinador tiene previsto constituir una fundación sin ánimo de lucro con el fin de sacar partido a los resultados de LivingKnowledge en un momento en el que, según todos los indicios, la demanda de esta clase de tecnología no hará sino aumentar. Según el profesor Giunchiglia, Google cambió radicalmente el mundo al dotar a toda la gente de acceso a gran parte de la información existente, pero lo hizo con las personas en mente. Actualmente sólo los humanos son capaces de comprender el significado de todos esos datos, tan abundantes que han dado lugar al problema tan extendido de la sobrecarga de datos. A medida que nos adentramos en la edad de los «grandes datos» (big data), en la que se puede disponer de información sobre cualquier tema con sólo pulsar un botón, es necesario que el significado de esa información sea comprensible no sólo para los humanos, sino también para las máquinas, buscando un equilibrio entre la cantidad y la calidad. El método propuesto por LivingKnowledge viene a resolver este problema. «Cuando emprendimos el proyecto nadie hablaba de los "grandes datos". Ahora todos lo hacen, y hay un interés cada vez mayor en esta clase de tecnología», destacó Giunchiglia. «Los grandes datos serán la idea fundamental en el futuro. No sabemos si esto será para bien o para mal, pero sin duda el panorama será bien distinto.» Contando con el Future Predictor del proyecto, el profesor Giunchiglia se encuentra bien equipado para formular esa predicción. La investigación realizada en LivingKnowledge fue financiada por el Séptimo Programa Marco (7PM) de la UE. (1) «LivingKnowledge: hechos, opiniones y sesgo en el tiempo» Enlaces útiles: - página web de LivingKnowledge - ficha informativa de LivingKnowledge en CORDIS

Reportaje - Tecnología de búsqueda capaz de sondear opiniones y predecir el futuro

Compartir esta página

Descargar