Provably Efficient Algorithms for Large-Scale Reinforcement Learning

Leistungen

The Open Research Data Pilot will be prepared and submitted to the European Commission

Veröffentlichungen

Efficient Global Planning in Large MDPs via Stochastic Primal-Dual Optimization

Autoren: Gergely Neu, Nneka Okolo
Veröffentlicht in: Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023), 2023
Herausgeber: Proceedings of Machine Learning Research

Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits

Autoren: Gergely Neu, Julia Olkhovskaya, Matteo Papini, Ludovic Schwartz
Veröffentlicht in: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), 2022
Herausgeber: NeurIPS foundation

Proximal Point Imitation Learning

Autoren: Luca Viano, Angeliki Kamoutsi, Gergely Neu, Igor Krawczuk, Volkan Cevher
Veröffentlicht in: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), 2022
Herausgeber: NeurIPS foundation

Online learning with off-policy feedback

Autoren: Germano Gabbianelli, Matteo Papini, Gergely Neu
Veröffentlicht in: Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023), 2023
Herausgeber: Proceedings of Machine Learning Research

Optimistic Planning by Regularized Dynamic Programming

Autoren: Antoine Moulin, Gergely Neu
Veröffentlicht in: International Conference on Machine Learning (ICML 2022), 2023
Herausgeber: Proceedings of Machine Learning Research

Generalization bounds via convex analysis

Autoren: Gabor Lugosi, Gergely Neu
Veröffentlicht in: Proceedings of Thirty Fifth Conference on Learning Theory (COLT 2022), 2022
Herausgeber: Proceedings of Machine Learning Research

Smoothing policies and safe policy gradients

Autoren: Matteo Papini; Matteo Pirotta; Marcello Restelli
Veröffentlicht in: Machine Learning, Ausgabe 111, 2022, Seite(n) 4081–4137, ISSN 1573-0565
Herausgeber: Springer
DOI: 10.1007/s10994-022-06232-6

Leistungen

Veröffentlichungen

Diese Seite teilen

Herunterladen