Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS

Data-Driven Verification and Learning Under Uncertainty

Projektbeschreibung

Überprüfungsmechanismen für das Verstärkungslernen

Verstärkungslernen ist eine Form des maschinellen Lernens, bei der ein Agent (KI) nach der Versuch-und-Irrtum-Methode lernt. Es mangelt jedoch generell an Mechanismen, die bei anspruchsvollen Aufgaben und Sicherheitsvorgaben ein konstant korrektes Verhalten gewährleisten. Formale Verifikation stützt sich auf strenge Methoden und präzise Spezifikationen, um die Korrektheit eines Systems zu garantieren. Es gibt allerdings kritische Herausforderungen, welche die Anwendung der formalen Verifikation im Verstärkungslernen verhindern. Im Rahmen des EU-finanzierten Projekts DEUCE werden innovative datengestützte Verifikationsmethoden entwickelt, die sich eng in das Verstärkungslernen integrieren lassen. Entworfen werden lernbasierte Abstraktionsschemata, welche die für die Korrektheit relevanten Systemteile herausdestillieren sowie Modelle verwenden und definieren, deren Ausdrucksmächtigkeit verschiedene Arten von Unsicherheit erfasst. DEUCE wird modellbasierte Mechanismen der formalen Verifikation liefern, um auf sichere und korrekte Art und Weise Agenten für Verstärkungslernen zu erforschen.

Ziel

Reinforcement learning (RL) agents learn to behave optimally via trial and error, without the need to encode complicated behavior explicitly. However, RL generally lacks mechanisms to constantly ensure correct behavior regarding sophisticated task and safety specifications.

Formal verification (FV), and in particular model checking, provides formal guarantees on a system's correctness based on rigorous methods and precise specifications. Despite active development by researchers from all over the world, fundamental challenges obstruct the application of FV to RL so far.

We identify three key challenges that frame the objectives of this proposal.
(1) Complex environments with large degrees of freedom induce large state and feature spaces. This curse of dimensionality poses a longstanding problem for verification.
(2) Common approaches for the correctness of RL systems employ idealized discrete state spaces.
However, realistic problems are often continuous.
(3) Knowledge about real-world environments is inherently uncertain.
To ensure safety, correctness guarantees need to be robust against such imprecise knowledge about the environment.

The main objective of the DEUCE project is to develop novel and data-driven verification methods that tightly integrate with RL. To cope with the curse of dimensionality, we devise learning-based abstraction schemes that distill the system parts that are relevant for the correctness. We employ and define models whose expressiveness captures various types of uncertainty. These models are the basis for formal and data-driven abstractions of continuous spaces. We provide model-based FV mechanisms that ensure safe and correct exploration for RL agents.

DEUCE will elevate the scalability and expressiveness of verification towards real-world deployment of reinforcement learning.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen

Schlüsselbegriffe

Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

HORIZON-ERC - HORIZON ERC Grants

Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

(öffnet in neuem Fenster) ERC-2022-STG

Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigen

Gastgebende Einrichtung

RUHR-UNIVERSITAET BOCHUM
Netto-EU-Beitrag

Finanzieller Nettobeitrag der EU. Der Geldbetrag, den der Beteiligte erhält, abzüglich des EU-Beitrags an mit ihm verbundene Dritte. Berücksichtigt die Aufteilung des EU-Finanzbeitrags zwischen den direkten Begünstigten des Projekts und anderen Arten von Beteiligten, wie z. B. Dritten.

€ 763 231,29
Adresse
UNIVERSITAETSSTRASSE 150
44801 Bochum
Deutschland

Auf der Karte ansehen

Region
Nordrhein-Westfalen Arnsberg Bochum, Kreisfreie Stadt
Aktivitätstyp
Higher or Secondary Education Establishments
Links
Gesamtkosten

Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.

€ 763 231,29

Begünstigte (2)

Mein Booklet 0 0