CORDIS - Forschungsergebnisse der EU
CORDIS

Provably Efficient Algorithms for Large-Scale Reinforcement Learning

Leistungen

Data Management Plan (DMP)

The Open Research Data Pilot will be prepared and submitted to the European Commission

Veröffentlichungen

Efficient Global Planning in Large MDPs via Stochastic Primal-Dual Optimization

Autoren: Gergely Neu, Nneka Okolo
Veröffentlicht in: Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023), 2023
Herausgeber: Proceedings of Machine Learning Research

Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits

Autoren: Gergely Neu, Julia Olkhovskaya, Matteo Papini, Ludovic Schwartz
Veröffentlicht in: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), 2022
Herausgeber: NeurIPS foundation

Proximal Point Imitation Learning

Autoren: Luca Viano, Angeliki Kamoutsi, Gergely Neu, Igor Krawczuk, Volkan Cevher
Veröffentlicht in: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), 2022
Herausgeber: NeurIPS foundation

Online learning with off-policy feedback

Autoren: Germano Gabbianelli, Matteo Papini, Gergely Neu
Veröffentlicht in: Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023), 2023
Herausgeber: Proceedings of Machine Learning Research

Optimistic Planning by Regularized Dynamic Programming

Autoren: Antoine Moulin, Gergely Neu
Veröffentlicht in: International Conference on Machine Learning (ICML 2022), 2023
Herausgeber: Proceedings of Machine Learning Research

Generalization bounds via convex analysis

Autoren: Gabor Lugosi, Gergely Neu
Veröffentlicht in: Proceedings of Thirty Fifth Conference on Learning Theory (COLT 2022), 2022
Herausgeber: Proceedings of Machine Learning Research

Smoothing policies and safe policy gradients

Autoren: Matteo Papini; Matteo Pirotta; Marcello Restelli
Veröffentlicht in: Machine Learning, Ausgabe 111, 2022, Seite(n) 4081–4137, ISSN 1573-0565
Herausgeber: Springer
DOI: 10.1007/s10994-022-06232-6

Suche nach OpenAIRE-Daten ...

Bei der Suche nach OpenAIRE-Daten ist ein Fehler aufgetreten

Es liegen keine Ergebnisse vor