Descripción del proyecto
Enseñar a la inteligencia artificial a ver y entender el mundo como los humanos
La inteligencia artificial ha dado saltos adelante en el lenguaje y la visión. Sin embargo, los sistemas actuales siguen sin poder comprender realmente el mundo con exactitud. En concreto, correlacionan palabras e imágenes, pero son incapaces de razonar con precisión sobre el espacio, el tiempo y el significado en concierto. Alcanzar esa unificación es primordial para lograr avances en robótica, conducción autónoma y asistentes inteligentes. En este contexto, el proyecto 4DLang, financiado por el Consejo Europeo de Investigación, pretende construir una abstracción simbólica y geométrica de las escenas físicas y convertirla en un lenguaje espaciotemporal. Ello permitirá a la inteligencia artificial procesar información espacial y semántica al unísono, lo que posibilitará un razonamiento más profundo y una comprensión similar a la humana en dominios del mundo real.
Objetivo
We have recently experienced a boost in AI as the performance of ChatGPT-like large language models has matured from a purely scientific endeavor to deployment in various businesses and real-world applications. Also in computer vision, we have seen tremendous gains that were enabled by scaling to large models trained on vast corpuses of data in an unsupervised fashion.
Language is symbolic and can inform about abstract properties and relationships, while vision without human labels does not model explicit semantics and brings distributed representations for spatial structures. Both are complementary, and the fundamental unsolved challenge is to bring them together. The current state of the art is to follow the common paradigm of scale and to naively train models on large amounts of data to exploit the co-occurence of objects in single images and words in text captions to learn their correlation. However, looking at the outputs of these models reveals that they in fact perform extremely poorly in many cases.
The next step to approach human-level AI requires reasoning about scenes spatially and semantically at the same time and demands an abstraction of our real world that brings both of these modalities together, while being lightweight and highly efficient. 4DLang presents the solution and introduces a new approach by first creating a primitive-based geometric symbolic abstraction of physical scenes that is then shaped into a spatio-temporal language. It will enable the fine-grained coupling of both modalities and go beyond the state of the art by augmenting large language models with real-world understanding that is only present in observations of moving scenes, as we humans perceive them. This design will fundamentally advance the generalization abilities of AI and have a large impact on downstream applications, such as content interpretation and generation, AI assistants, robotics, and autonomous driving.
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..
- ingeniería y tecnología ingeniería eléctrica, ingeniería electrónica, ingeniería de la información ingeniería electrónica robótica
Para utilizar esta función, debe iniciar sesión o registrarse
Palabras clave
Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).
Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).
Programa(s)
Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.
Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.
-
HORIZON.1.1 - European Research Council (ERC)
PROGRAMA PRINCIPAL
Ver todos los proyectos financiados en el marco de este programa
Tema(s)
Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.
Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.
Régimen de financiación
Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.
Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.
HORIZON-ERC - HORIZON ERC Grants
Ver todos los proyectos financiados en el marco de este régimen de financiación
Convocatoria de propuestas
Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.
Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.
(se abrirá en una nueva ventana) ERC-2025-STG
Ver todos los proyectos financiados en el marco de esta convocatoriaInstitución de acogida
Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.
90461 NUREMBERG
Alemania
Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.