Los datos masivos tienen éxito
Desde los negocios hasta la ciencia, la economía o incluso las finanzas, los datos masivos están en todas partes. «Con los datos masivos, los analistas financieros pueden procesar de manera instantánea datos de cientos de acciones, los minoristas pueden mantener registros de lo último que ha comprado una persona y los economistas pueden proporcionar predicciones en tiempo real sobre el estado de la economía», afirma Ines Wilms, investigadora de la Universidad de Maastricht. Sin embargo, como señala Wilms, antes de poder hacer nada de esto, se necesitan las herramientas adecuadas. «Aunque los datos masivos se han utilizado durante años, solo ahora empezamos a comprender la importancia de tener un conjunto de herramientas estadísticas adecuadas para extraer la información que necesitamos», añade. Con el apoyo del proyecto financiado con fondos europeos BigTime, Wilms está trabajando a fin de desarrollar las herramientas estadísticas que necesitan los economistas para tomar decisiones con mayor confianza mediante el uso de datos masivos.
Una mejor forma de abordar los problemas con los datos masivos
Mediante una combinación de estadística, aprendizaje automático y econometría, el proyecto desarrolló métodos de aprendizaje estadístico y el «software» correspondiente para abordar los problemas con los datos masivos. Concretamente, el conjunto de herramientas está dirigido a ayudar a investigadores, analistas de datos y estudiantes a la hora de realizar estimaciones fiables y predicciones precisas, cuantificar su incertidumbre y realizar inferencias sobre efectos causales. «Con estos métodos, un usuario podría, por ejemplo, comprender cómo el conjunto de información masiva de un banco central puede utilizarse para predecir el producto interior bruto de un país este trimestre y el que viene», explica Wilms. «El modelo también podría ayudar a determinar los efectos de la política de un banco central a lo largo del tiempo». El «software», llamado bigtime y ahora públicamente disponible, fue diseñado para satisfacer las necesidades de diversos usuarios. «Para los expertos, ofrecemos todos los códigos informáticos en libre acceso y los combinamos con documentación fácil de utilizar, de manera que el usuario pueda navegar fácilmente por ella», destaca Wilms. «Para los principiantes, proporcionamos aplicaciones basadas en la web que los guían a través de series temporales de conceptos básicos y casos de uso sencillos».
Un gran éxito
Según Wilms, bigtime ya es un gran éxito. «El “software” ya tiene más de veinticinco mil descargas», comenta. «Espero que los números sigan creciendo a medida que más investigadores, analistas de negocios y estudiantes descubran el rico campo de los datos masivos». A pesar del éxito, Wilms está lejos de haber terminado. «Esta Acción Marie Skłodowska-Curie hizo que me diera cuenta de que hay mucho más que hacer y descubrir en el emocionante ámbito del análisis causal para las series temporales de alta dimensionalidad», añade. En la actualidad, Wilms está centrada en su trabajo sobre el uso de métodos de aprendizaje estadístico para el análisis causal y en la ampliación del conjunto de herramientas de «software». «Espero poder llevar nuestro “software” a un público más amplio, fuera del mundo académico, a socios empresariales y de la industria interesados en él», concluye Wilms. «Con este objetivo, hemos desarrollado un curso de análisis de series temporales y predicción para la plataforma BlueCourses que muestra algunos de los métodos desarrollados durante el proyecto BigTime.
Palabras clave
BigTime, datos masivos, herramientas estadísticas, economistas, financiero, economía, aprendizaje automático, «software», libre acceso, series temporales