Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS

Provably Efficient Algorithms for Large-Scale Reinforcement Learning

CORDIS bietet Links zu öffentlichen Ergebnissen und Veröffentlichungen von HORIZONT-Projekten.

Links zu Ergebnissen und Veröffentlichungen von RP7-Projekten sowie Links zu einigen Typen spezifischer Ergebnisse wie Datensätzen und Software werden dynamisch von OpenAIRE abgerufen.

Leistungen

Data Management Plan (DMP) (öffnet in neuem Fenster)

The Open Research Data Pilot will be prepared and submitted to the European Commission

Veröffentlichungen

Offline Primal-Dual Reinforcement Learning for Linear MDPs

Autoren: G. Gabbianelli, G. Neu, N. Okolo, M. Papini
Veröffentlicht in: Proceedings of the Twenty-seventh International Conference on Artificial Intelligence and Statistics (AISTATS), 2024
Herausgeber: Proceedings of Machine Learning Research

Scalable Representation Learning in Linear Contextual Bandits with Constant Regret Guarantees (öffnet in neuem Fenster)

Autoren: Tirinzoni A.; Papini M.; Touati A.; Lazaric A.; Pirotta M.
Veröffentlicht in: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), 2022
Herausgeber: NeurIPS foundation
DOI: 10.48550/arxiv.2210.13083

Efficient Global Planning in Large MDPs via Stochastic Primal-Dual Optimization

Autoren: Gergely Neu, Nneka Okolo
Veröffentlicht in: Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023), 2023
Herausgeber: Proceedings of Machine Learning Research

Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits

Autoren: Gergely Neu, Julia Olkhovskaya, Matteo Papini, Ludovic Schwartz
Veröffentlicht in: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), 2022
Herausgeber: NeurIPS foundation

Nonstochastic Contextual Combinatorial Bandits

Autoren: L. Zierahn, D. van der Hoeven, N. Cesa-Bianchi, G. Neu
Veröffentlicht in: Proceedings of the Twenty-sixth International Conference on Artificial Intelligence and Statistics (AISTATS), 2023
Herausgeber: Proceedings of Machine Learning Research

Optimistic Information-Directed Sampling

Autoren: G. Neu, M. Papini, L. Schwartz
Veröffentlicht in: Proceedings of the 36th Annual Conference on Learning Theory (COLT), 2024
Herausgeber: Proceedings of Machine Learning Research

Dealing with Unbounded Gradients in Stochastic Saddle-Point Optimizaiton

Autoren: G. Neu, N. Okolo
Veröffentlicht in: Proceedings of the 41st International Conference on Machine Learning (ICML), 2024
Herausgeber: Proceedings of Machine Learning Research

Proximal Point Imitation Learning

Autoren: Luca Viano, Angeliki Kamoutsi, Gergely Neu, Igor Krawczuk, Volkan Cevher
Veröffentlicht in: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), 2022
Herausgeber: NeurIPS foundation

Importance-Weighted Offline Learning Done Right

Autoren: G. Gabbianelli, G. Neu, M. Papini
Veröffentlicht in: Proceedings of the 34th International Conference on Algorithmic Learning Theory (ALT), 2024
Herausgeber: Proceedings of Machine Learning Research

Online learning with off-policy feedback

Autoren: Germano Gabbianelli, Matteo Papini, Gergely Neu
Veröffentlicht in: Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023), 2023
Herausgeber: Proceedings of Machine Learning Research

First-and Second-Order Bounds for Adversarial Linear Contextual Bandits

Autoren: J. Olkhovskaya, J. Mayo, T. van Erven, G. Neu, C.-Y. Wei
Veröffentlicht in: Advances in Neural Information Processing Systems 36 (NeurIPS), 2023
Herausgeber: NeurIPS foundation

Optimistic Planning by Regularized Dynamic Programming

Autoren: Antoine Moulin, Gergely Neu
Veröffentlicht in: International Conference on Machine Learning (ICML 2022), 2023
Herausgeber: Proceedings of Machine Learning Research

Generalization bounds via convex analysis

Autoren: Gabor Lugosi, Gergely Neu
Veröffentlicht in: Proceedings of Thirty Fifth Conference on Learning Theory (COLT 2022), 2022
Herausgeber: Proceedings of Machine Learning Research

Adversarial Contextual Bandits Go Kernelized

Autoren: G. Neu, J. Olkhovskaya, S. Vakili
Veröffentlicht in: Proceedings of the 34th International Conference on Algorithmic Learning Theory (ALT), 2024
Herausgeber: Proceedings of Machine Learning Research

Smoothing policies and safe policy gradients (öffnet in neuem Fenster)

Autoren: Matteo Papini; Matteo Pirotta; Marcello Restelli
Veröffentlicht in: Machine Learning, Ausgabe 111, 2022, Seite(n) 4081–4137, ISSN 1573-0565
Herausgeber: Springer
DOI: 10.1007/s10994-022-06232-6

A note on regularised NTK dynamics with an application to PAC-Bayesian training (öffnet in neuem Fenster)

Autoren: Clerico, Eugenio; Guedj, Benjamin
Veröffentlicht in: Transactions on Machine Learning Research, 2024, ISSN 2835-8856
Herausgeber: Transactions on Machine Learning Research
DOI: 10.48550/arxiv.2312.13259

Suche nach OpenAIRE-Daten ...

Bei der Suche nach OpenAIRE-Daten ist ein Fehler aufgetreten

Es liegen keine Ergebnisse vor

Mein Booklet 0 0