Description du projet
Faire évoluer les solutions d’apprentissage de l’IA
L’apprentissage automatique (AA) et l’IA ont réalisé des avancées considérables ces dernières années, suscitant une attention croissante pour leur potentiel d’automatisation, de recherche, de découverte de médicaments, de microchimie et d’autres domaines. Malgré ces progrès, les systèmes d’AA peinent toutefois souvent à s’adapter à des distributions de données changeantes, ce qui les empêche de passer le stade de la validation de concept. Le projet ConSequentIAL, financé par le CER, entend relever ce défi en développant un système d’IA à apprentissage continu et séquentiel. Ce système intégrera des méthodologies d’apprentissage supervisé et non supervisé, des techniques avancées de collecte de données et des outils d’apprentissage par renforcement (RL). Le projet fera progresser la théorie du RL pour créer des systèmes de RL non stationnaires et développer de nouveaux principes algorithmiques, permettant une meilleure adaptabilité aux changements externes et améliorant la flexibilité et la robustesse des systèmes d’IA.
Objectif
Machine Learning systems, while promising, lack the autonomy needed for many real-world applications beyond mere proof-of-concept stages. The key challenge lies in enabling AI to continuously adapt to shifting data distributions and proactively seek information under high uncertainty.
Fields such as drug discovery and micro-chemistry are expecting breakthroughs from AI, given the vast and intricate search spaces they deal with, coupled with expensive data acquisition. It is vital for algorithms to steer this search, assimilate new data, and strategically explore promising zones.
Reinforcement Learning (RL) offers tools and methods for agents to autonomously learn from their actions, but its efficacy has been largely confined to stationary, single-task settings.
ConSequentIAL's vision is a Continual and Sequential Learning AI that marries supervised and unsupervised learning with advanced data gathering and RL-driven discovery mechanisms.
To achieve these goals, I propose to bridge the theory of constrained and non-stationary RL to build a sound and useful mathematical formulation of the problem. On these new solid grounds, I develop novel algorithmic principles that allow the agent to detect and respond to external shifts, while remaining aware of her own impact on the system she interacts with. I address the memory-versus-stability trade-off central to continual learning by enabling agents to actively plan their skill acquisition in accordance with their long-term goals.
The ambition of this project is to position AI to tackle the consequential scientific challenges ahead.
Programme(s)
- HORIZON.1.1 - European Research Council (ERC) Main Programme
Thème(s)
Appel à propositions
(s’ouvre dans une nouvelle fenêtre) ERC-2024-STG
Voir d’autres projets de cet appelRégime de financement
HORIZON-ERC - HORIZON ERC GrantsInstitution d’accueil
72074 Tuebingen
Allemagne