Los servicios en la nube apoyan el desarrollo de aplicaciones de aprendizaje automático

La programación de «software» ordinario es difícil. Hacerlo para aplicaciones de superordenadores de aprendizaje automático es tan difícil que incluso los expertos necesitan ayuda.

Economía digital

Los grupos de investigación europeos esperan cada vez más utilizar los servicios en la nube. Esto podría servir para el procesamiento o el almacenamiento, o una combinación de ambos. Hacerlo normalmente requeriría tratar con una configuración de máquina de bajo nivel, un proceso largo y difícil que requiere personal especializado. En el proyecto DEEP-HybridDataCloud(se abrirá en una nueva ventana), financiado con fondos europeos, se ha desarrollado una alternativa. Mientras que otros servicios en la nube proporcionan esencialmente acceso a los recursos de «hardware», en este proyecto se desarrollaron servicios de alto nivel que permiten la investigación. Se trata de componentes de «software» que permiten el desarrollo, el aprovechamiento y el intercambio de aplicaciones de ciencia de datos exigentes en capacidad de computación. Los componentes simplifican el ciclo de vida de desarrollo de las aplicaciones con inteligencia artificial, aprendizaje automático o aprendizaje profundo. Los servicios también proporcionan un acceso transparente a las infraestructuras electrónicas de la Unión Europea y a los componentes de «hardware» especializados (como los aceleradores), ocultando al mismo tiempo la complejidad subyacente. El trabajo del proyecto se basa en el trabajo anterior del proyecto INDIGO-DataCloud. Los comentarios de los clientes obtenidos durante esa iniciativa permitieron a los investigadores de DEEP-HybridDataCloud desarrollar la tecnología necesaria para satisfacer las expectativas de los usuarios. Según explica el coordinador del proyecto, Álvaro López García: «Estamos aprovechando el modelo híbrido de servicios en la nube con el fin de reunir recursos de forma continua entre los diferentes proveedores de servicios en la nube públicos y privados, para que los usuarios puedan aprovecharlos con transparencia».

Diferentes tipos de usuario objetivo

El equipo del proyecto identificó tres tipos de usuarios, en función de la cantidad de conocimientos que tengan sobre la ciencia, el aprendizaje automático y la tecnología. El primero tiene un gran conocimiento de su campo de estudio, junto con un problema que puede ser resuelto utilizando los modelos de aprendizaje automático de capas en la nube a los que el proyecto permite acceder. Estos usuarios interactúan con un servicio de caja negra solo para obtener funcionalidad y no necesitan saber nada sobre cómo se ejecutan los modelos. El segundo grupo de usuarios tiene conocimientos sobre su ámbito científico y el aprendizaje automático. Estos usuarios suelen ser científicos de datos que desarrollan una aplicación de aprendizaje profundo. Este grupo sabe qué «hardware» acelerador necesita, pero no quiere preocuparse por obtenerlo o configurarlo. El proyecto proporciona a estos usuarios herramientas a nivel de plataforma, con las que pueden especificar sus requisitos de «hardware» o de formación. El último tipo de usuarios conoce los tres ámbitos. Ellos también desarrollarán aplicaciones para el aprendizaje automático científico, pero tendrán los suficientes conocimientos tecnológicos para saber sus necesidades de infraestructura. El proyecto permite a estos usuarios un acceso personalizado a todo el conjunto de servicios en la nube.

Pruebas de diferentes aplicaciones científicas

Varios grupos de investigación han utilizado con éxito los servicios. Los componentes de «software» ya desarrollados están disponibles a través de la página pública del proyecto DEEP Open Catalog(se abrirá en una nueva ventana). En ellas se abordan numerosas ramas de la ciencia, entre ellas el seguimiento de la biodiversidad de la ciencia ciudadana y la identificación de especies, además del reconocimiento de patrones conexos en imágenes satelitales. Otros temas son la vigilancia de la ciberseguridad y la detección de amenazas en las redes, los módulos para poner a prueba el marco DEEP y los componentes polivalentes. López García añade: «Nuestro principal resultado final es la inclusión de nuestros servicios en la Nube Europea de la Ciencia Abierta(se abrirá en una nueva ventana), por lo que nos hemos convertido en su proveedor de servicios de aprendizaje automático». El equipo seguirá prestando apoyo a los servicios existentes, al tiempo que desarrollará nuevas funciones solicitadas por los usuarios y buscará oportunidades comerciales. La labor en curso facilitará el desarrollo de aplicaciones de aprendizaje automático en apoyo de la investigación científica europea.