Skip to main content

Integrated and Detailed Image Understanding

Article Category

Article available in the folowing languages:

Enseñar a la inteligencia artificial a aprender por sí misma

La finalidad de unos nuevos algoritmos es proporcionar a la inteligencia artificial la capacidad no solo de identificar objetos, sino también de interpretar lo que ve.

Economía digital

Los seres humanos empleamos la vista para casi todo lo que hacemos, un comportamiento que se suele da por sentado. Sin embargo, ser capaz de dar sentido a una imagen es un proceso extraordinariamente complejo. De hecho, algunos investigadores calculan que cerca de la mitad del cerebro está implicado en la visión. «Este proceso complejo nos permite ver no solo un automóvil, sino un automóvil azul, no solo una persona, sino un hombre con una camiseta roja», comenta Andrea Vedaldi, catedrático de Visión Artificial y Aprendizaje Automático en la Universidad de Oxford. Según Vedaldi, esta comprensión detallada de lo que se ve es fundamental para tomar decisiones. «Si vemos un semáforo en rojo y otro vehículo que no frena, lo interpretamos de inmediato como una situación potencialmente peligrosa y actuamos en consecuencia», añade el investigador. Y aquí radica el principal problema de la inteligencia artificial (IA): la IA funciona bastante bien a la hora de identificar objetos, pero carece de la capacidad de interpretar lo que ve, lo que puede ser problemático en aplicaciones como vehículos autónomos o drones sin piloto. «Mientras que los bebés aprenden a comprender las imágenes por sí mismos, con poca o ninguna intervención externa, la IA debe aprender esta habilidad a través de un largo y elaborado proceso de supervisión manual», explica Vedaldi. Vedaldi y su equipo de investigadores trabajan para abordar este obstáculo con el respaldo del proyecto financiado con fondos europeos IDIU. «Nuestro objetivo era desarrollar una nueva generación de algoritmos de comprensión de imágenes con una potencia y una flexibilidad más próximas a la visión humana», apunta Vedaldi.

Sin supervisión

En el proyecto IDIU, que recibió el apoyo del Consejo Europeo de Investigación (ERC, por sus siglas en inglés), se aborda una de las principales limitaciones de la visión artificial moderna: la necesidad de supervisión. Si bien los algoritmos pueden aprender a resolver tareas complejas de análisis de imágenes, para hacerlo, primero requieren miles, cuando no millones, de ejemplos etiquetados, es decir, imágenes que se anotan manualmente con su interpretación. No hace falta decir que esto tiene un coste significativo. Para agilizar este proceso, los investigadores del proyecto desarrollaron varias tecnologías innovadoras como, por ejemplo, algoritmos que pueden «realizar su propia investigación». Pueden llevarla a cabo consultando de forma automática recursos de internet como Google y Wikipedia, así como a través de un nuevo método matemático para aprender la geometría de los objetos en imágenes y vídeos sin necesidad de una fuente externa de supervisión. «Demostramos, por primera vez, que es posible aprender la estructura espacial de los objetos con solo mirar imágenes, sin supervisión externa», comenta Vedaldi. «Es decir, un algoritmo puede aprender de forma independiente que una persona tiene dos brazos, dos piernas y una cierta pose».

Flexibilidad casi humana

Si bien la IA aún está hoy muy lejos de igualar a la inteligencia humana, los desarrollos logrados por el equipo del proyecto IDIU le otorgan un nivel de flexibilidad casi humana. «El trabajo del proyecto, pionero en nueva subárea de IA que denominamos aprendizaje interno, tendrá una gran repercusión en la investigación y la industria futuras», añade Vedaldi. Su repercusión ya es un hecho, ya que los resultados del proyecto se están utilizando hoy día en una subvención de consolidación del ERC. «Al emplear los hallazgos de IDIU como base, ahora estamos construyendo máquinas que pueden aprender a ver de forma totalmente automática a través de la asimilación pasiva de imágenes y vídeos grabados por casualidad», concluye Vedaldi. «Esperamos que esta tecnología facilite sobre manera el empleo de la visión artificial, convirtiéndola así en una herramienta flexible y útil para muchas de las aplicaciones críticas del futuro».

Palabras clave

IDIU, inteligencia artificial, IA, algoritmos, visión artificial, aprendizaje automático

Descubra otros artículos del mismo campo de aplicación