Data-Driven Verification and Learning Under Uncertainty

Informations projet

DEUCE

N° de convention de subvention: 101077178

DOI

10.3030/101077178

Date de signature de la CE 6 Decembre 2022

Date de début 1 Janvier 2023

Date de fin 31 Decembre 2027

Financé au titre de

European Research Council (ERC)

Coût total

€ 1 500 000,00

Contribution de l’UE

€ 1 500 000,00

1 500 000,00

Coordonné par

RUHR-UNIVERSITAET BOCHUM
Germany

Description du projet

Des mécanismes de vérification pour l’apprentissage par renforcement

L’apprentissage par renforcement (AR) est une méthode d’entraînement automatique qui permet à un agent (IA) d’apprendre par essais et erreurs. Cependant, cette technique pâtit souvent d’un déficit de mécanismes permettant d’assurer un fonctionnement toujours correct en ce qui concerne les tâches sophistiquées et les spécifications de sécurité. La vérification formelle (VF) s’appuie sur des méthodes rigoureuses et des spécifications précises pour garantir l’exactitude d’un système. Toutefois, des problématiques critiques limitent fortement l’application de la VF à l’AR. Le projet DEUCE, financé par l’UE, entend élaborer des solutions de vérification innovantes reposant sur les données qui s’intégreront étroitement à l’AR. Il concevra des schémas d’abstraction fondés sur l’apprentissage qui condenseront les parties du système pertinentes pour l’exactitude et l’utilisation, et définira des modèles dont l’expressivité tiendra compte de plusieurs types d’incertitude. DEUCE fournira des mécanismes de VF s’appuyant sur des modèles pour explorer les agents AR de manière sûre et exacte.

Objectif

Reinforcement learning (RL) agents learn to behave optimally via trial and error, without the need to encode complicated behavior explicitly. However, RL generally lacks mechanisms to constantly ensure correct behavior regarding sophisticated task and safety specifications.

Formal verification (FV), and in particular model checking, provides formal guarantees on a system's correctness based on rigorous methods and precise specifications. Despite active development by researchers from all over the world, fundamental challenges obstruct the application of FV to RL so far.

We identify three key challenges that frame the objectives of this proposal.
(1) Complex environments with large degrees of freedom induce large state and feature spaces. This curse of dimensionality poses a longstanding problem for verification.
(2) Common approaches for the correctness of RL systems employ idealized discrete state spaces.
However, realistic problems are often continuous.
(3) Knowledge about real-world environments is inherently uncertain.
To ensure safety, correctness guarantees need to be robust against such imprecise knowledge about the environment.

The main objective of the DEUCE project is to develop novel and data-driven verification methods that tightly integrate with RL. To cope with the curse of dimensionality, we devise learning-based abstraction schemes that distill the system parts that are relevant for the correctness. We employ and define models whose expressiveness captures various types of uncertainty. These models are the basis for formal and data-driven abstractions of continuous spaces. We provide model-based FV mechanisms that ensure safe and correct exploration for RL agents.

DEUCE will elevate the scalability and expressiveness of verification towards real-world deployment of reinforcement learning.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

sciences naturelles informatique et science de l'information ingénierie de la connaissance

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

HORIZON.1.1 - European Research Council (ERC) PROGRAMME PRINCIPAL
Voir tous les projets financés dans le cadre de ce programme

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

ERC-2022-STG - ERC STARTING GRANTS
Voir tous les projets financés dans ce domaine

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

HORIZON-ERC - HORIZON ERC Grants

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) ERC-2022-STG

Voir tous les projets financés au titre de cet appel

Institution d’accueil

RUHR-UNIVERSITAET BOCHUM

Contribution nette de l'UE

€ 763 231,29

Adresse

UNIVERSITAETSSTRASSE 150
44801 Bochum
Allemagne

Région

Nordrhein-Westfalen Arnsberg Bochum, Kreisfreie Stadt

Type d’activité

Higher or Secondary Education Establishments

Liens

Contacter l’organisation

Site web

Participation aux programmes de R&I de l'UE

Réseau de collaboration HORIZON

Coût total

€ 763 231,29

Bénéficiaires (2)

RUHR-UNIVERSITAET BOCHUM

Allemagne

Contribution nette de l'UE

€ 763 231,29

STICHTING RADBOUD UNIVERSITEIT

Pays-Bas

Contribution nette de l'UE

€ 736 768,71

Description du projet

Des mécanismes de vérification pour l’apprentissage par renforcement

Objectif

Champ scientifique (EuroSciVoc) CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Mots‑clés Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s) Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s) Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

Institution d’accueil

Bénéficiaires (2)

Télécharger Télécharger le contenu de la page

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.