Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Contenido archivado el 2024-06-18

Sublinear Optimization for Machine Learning

Article Category

Article available in the following languages:

Optimizar los algoritmos de optimización

Muchos problemas contemporáneos, y más en concreto los que surgen en el aprendizaje automático, contienen demasiados datos como para aplicarles algoritmos de optimización estándar. Científicos financiados con fondos de la Unión Europea crearon algoritmos nuevos que precisan una fracción de los datos de entrada normales, logrando así reducir el tiempo de ejecución.

Los listados de tráfico en Internet o las transacciones financieras son dos ejemplos de corpus de datos masivos cada vez más frecuentes en distintas aplicaciones. El análisis y la gestión de estos corpus obligan a los científicos a reconsiderar los métodos convencionales de desarrollo de algoritmos de optimización eficaces. Estos algoritmos se emplean para evaluar contrapartidas del diseño y señalar patrones en los corpus. Los algoritmos de aprendizaje automático suelen identificar características que contribuyen a realizar las tareas de clasificación. Así, el dar con el conjunto de características más pequeño con el valor predictivo más elevado no es sino un problema de optimización. Un equipo científico perteneciente al proyecto financiado con fondos europeos SUBLINEAROPTML (Sublinear optimization for machine learning) desarrolló algoritmos que se ejecutan en tiempo sublineal para resolver este tipo de problemas de optimización. Los algoritmos se basan en una combinación de técnicas de muestreo avanzadas y una implementación aleatorizada de algoritmos de aprendizaje en línea. Estos últimos realizan una predicción por cada elemento del flujo de datos y, tras recibir una valoración, aumentan su precisión en las predicciones siguientes. Esto es, no plantean presuposiciones sobre los datos de entrada a la manera del aprendizaje automático estadístico. Los algoritmos nuevos aprovechan la aleatorización para limpiar los datos y generar soluciones correctas a pesar de que su tiempo de ejecución es menor que la representación de los datos, en lo que se denomina tiempo sublineal. El equipo al cargo mostró que los tiempos de ejecución de la mayoría de estos algoritmos son los menores posibles en modelos de máquinas de acceso aleatorio. Los algoritmos también pueden ampliarse a versiones kernelizadas de los problemas de optimización de máquinas de soporte vectorial para las que no existen solucionadores en tiempo sublineal. Los progresos logrados en el ámbito del aprendizaje automático se presentaron en varios congresos internacionales. SUBLINEAROPTML generó así un método que podría resultar más eficaz para resolver algunos de los problemas de optimización más arduos. Cabe así la posibilidad de que los enrutadores utilicen en el futuro los algoritmos nuevos para calcular la ruta más rápida en una red congestionada.

Palabras clave

Optimización de algoritmos, aprendizaje automático, corpus gigantescos, problema de optimización, algoritmo de aprendizaje

Descubra otros artículos del mismo campo de aplicación