Projektbeschreibung
Große dynamische Systeme durch Verstärkungslernen robust und energiesparend steuern
Die Verbesserung der energie- und rechenintensiven Analyse von Big Data stellt in vielen Bereichen von der Grundlagenforschung über die Entstehung des Universums bis hin zur Vorhersage des Klimawandels oder der Steuerung großer dynamischer Systeme in sicherheitskritischen technischen Anwendungen ein wichtiges Ziel dar. Verstärkungslernen ist eine vielversprechende Methode zur Verringerung des Energiebedarfs im letztgenannten Bereich. Lineare oder Kern-Methoden sind jedoch nicht gut skalierbar, was ihre Nutzbarkeit in praktischen Anwendungen minimiert. Außerdem sind sie rechenintensiv und verbrauchen daher viel Energie. Das Team des ERC-finanzierten Projekts KoOpeRaDE zielt darauf ab, Steuerungstheorie, Approximationstheorie und maschinelles Lernen einzusetzen, um die Komplexität zu reduzieren und die Entwicklung innovativer Steuerungseinrichtungen für Verstärkungslernen für großmaßstäbliche technische Systeme mit Leistungsgarantien zu unterstützen.
Ziel
An unprecedented energy crisis is looming over us. In order to transition to a greener and more energy-efficient society, existing technologies need to be improved and novel techniques such as nuclear fusion developed. This requires the stabilization of aerodynamics, heat transfer or combustion and fusion processes and thus, the development of efficient control strategies for large-scale dynamical systems. In recent years, reinforcement learning (RL) has emerged as a highly promising data-driven technique. Unfortunately, we cannot trust RL to handle our most important and complex systems, since the resulting controllers do not possess performance guarantees. Certifiable RL approaches such as linear or kernel methods tend to scale poorly, such that their applicability is limited to toy examples. In contrast to other application areas, this is a complete show-stopper for safety-critical engineering. Moreover, the training is extremely data hungry and costly, due to which RL itself contributes to the energy crisis.
The vision of this project is to develop new foundational methods to equip RL controllers for large-scale engineering systems with performance guarantees by exploiting system knowledge and systematically reducing the complexity. To achieve this, I will target three major breakthroughs, consisting of (A) global linearization of the dynamics via the Koopman operator framework, (B) the extension of certified Q-learning to continuous action spaces via control quantization, and (C) the detection and exploitation of symmetries in the system dynamics.
The project requires significant joint advancements in several challenging areas such as control, approximation theory and machine learning. In the case of success, the resulting controllers will provide a massive advancement of RL towards safety-critical engineering applications and significantly contribute to the challenge of meeting the future energy demands of our society.
Wissenschaftliches Gebiet (EuroSciVoc)
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.
Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen
Wir bitten um Entschuldigung ... während der Ausführung ist ein unerwarteter Fehler aufgetreten.
Sie müssen sich authentifizieren. Ihre Sitzung ist möglicherweise abgelaufen.
Vielen Dank für Ihr Feedback. Sie erhalten in Kürze eine E-Mail zur Übermittlungsbestätigung. Wenn Sie sich für eine Benachrichtigung über den Berichtsstatus entschieden haben, werden Sie auch im Falle einer Änderung des Berichtsstatus benachrichtigt.
Schlüsselbegriffe
Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).
Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).
Programm/Programme
Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.
Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.
-
HORIZON.1.1 - European Research Council (ERC)
HAUPTPROGRAMM
Alle im Rahmen dieses Programms finanzierten Projekte anzeigen
Thema/Themen
Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.
Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.
Finanzierungsplan
Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.
Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.
HORIZON-ERC - HORIZON ERC Grants
Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen
Aufforderung zur Vorschlagseinreichung
Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.
Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.
(öffnet in neuem Fenster) ERC-2024-STG
Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigenGastgebende Einrichtung
Finanzieller Nettobeitrag der EU. Der Geldbetrag, den der Beteiligte erhält, abzüglich des EU-Beitrags an mit ihm verbundene Dritte. Berücksichtigt die Aufteilung des EU-Finanzbeitrags zwischen den direkten Begünstigten des Projekts und anderen Arten von Beteiligten, wie z. B. Dritten.
44227 Dortmund
Deutschland
Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.