Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Deep Bayesian Reinforcement Learning -- Unifying Perception, Planning, and Control

Objetivo

For robots to assist humanity in homes, or hospitals, the capability to manipulate diverse objects is imperative. So far, however, robotic manipulation technology has struggled in managing the uncertainty and unstructuredness that characterize human environments.
Machine learning is a natural approach -- the robot can adapt to a given scenario, even if it was not programmed to handle it beforehand. Indeed, Deep Reinforcement Learning (deep RL), which has recently led to AI breakthroughs in computer games, has been publicized as the learning-based approach to robotics. To date, however, deep RL studies focused on known and observable systems, where uncertainty was resolved by lengthy trial and error. Quickly learning to act in novel environments, as required for robotics, is not yet within our reach.
The crux of the matter is the tight coupling between perception and control under high uncertainty -- the robot must actively reduce uncertainty while also trying to solve the task; for complex and high-dimensional systems, we do not have a suitable algorithmic framework for this.

In this proposal, our overarching goal is to:
Develop the algorithmic framework of using deep learning in problems that tightly couple perception, planning, and control, for advancing robotic AI to reliably manipulate general objects in unstructured environments.

Towards this end, we shall develop neural network representations of uncertainty, and algorithms that estimate uncertainty from data. We will develop theory and algorithms for decision making under uncertainty, bringing in a fresh perspective to the problem based on Bayesian reinforcement learning (Bayes-RL). These advances will allow us to study safety certificates for deep RL, and develop a general and practical methodology for learning-based robotic manipulation under uncertainty, validated on real robot experiments. Aside from robotic manipulation, we expect impact on various fields where decision making plays an important role.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Palabras clave

Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-ERC - HORIZON ERC Grants

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) ERC-2021-STG

Ver todos los proyectos financiados en el marco de esta convocatoria

Institución de acogida

TECHNION - ISRAEL INSTITUTE OF TECHNOLOGY
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 1 500 000,00
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

€ 1 500 000,00

Beneficiarios (1)

Mi folleto 0 0