Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Coevolutionary Policy Search

CORDIS fournit des liens vers les livrables publics et les publications des projets HORIZON.

Les liens vers les livrables et les publications des projets du 7e PC, ainsi que les liens vers certains types de résultats spécifiques tels que les jeux de données et les logiciels, sont récupérés dynamiquement sur OpenAIRE .

Publications

Alternating Optimisation and Quadrature for Robust Control

Auteurs: Paul, Supratik; Chatzilygeroudis, Konstantinos; Ciosek, Kamil; Mouret, Jean-Baptiste; Osborne, Michael A.; Whiteson, Shimon
Publié dans: AAAI 2018 - The Thirty-Second AAAI Conference on Artificial Intelligence, Numéro 1, 2018
Éditeur: AAAI

Growing Action Spaces

Auteurs: Farquhar, Gregory; Gustafson, Laura; Lin, Zeming; Whiteson, Shimon; Usunier, Nicolas; Synnaeve, Gabriel
Publié dans: Numéro 1, 2020
Éditeur: ICML

TreeQN and ATreeC: Differentiable Tree-Structured Models for Deep Reinforcement Learning

Auteurs: Farquhar, Gregory; Rocktäschel, Tim; Igl, Maximilian; Whiteson, Shimon
Publié dans: Numéro 1, 2018
Éditeur: ICLR

DAC: The Double Actor-Critic Architecture for Learning Options

Auteurs: Zhang, Shangtong; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: NeurIPS

VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning

Auteurs: Zintgraf, Luisa; Shiarlis, Kyriacos; Igl, Maximilian; Schulze, Sebastian; Gal, Yarin; Hofmann, Katja; Whiteson, Shimon
Publié dans: Numéro 1, 2020
Éditeur: ICLR

Fast Context Adaptation via Meta-Learning

Auteurs: Zintgraf, Luisa M; Shiarlis, Kyriacos; Kurin, Vitaly; Hofmann, Katja; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: ICML

Fingerprint Policy Optimisation for Robust Reinforcement Learning

Auteurs: Paul, Supratik; Osborne, Michael A.; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: ICML

MAVEN: Multi-Agent Variational Exploration

Auteurs: Mahajan, Anuj; Rashid, Tabish; Samvelyan, Mikayel; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: NeurIPS

Learning Retrospective Knowledge with Reverse Reinforcement Learning

Auteurs: Zhang, Shangtong; Veeriah, Vivek; Whiteson, Shimon
Publié dans: Numéro 1, 2020
Éditeur: NeurIPS

Fast Efficient Hyperparameter Tuning for Policy Gradients

Auteurs: Paul, Supratik; Kurin, Vitaly; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: NeurIPS

A Survey of Reinforcement Learning Informed by Natural Language

Auteurs: Luketina, Jelena; Nardelli, Nantas; Farquhar, Gregory; Foerster, Jakob; Andreas, Jacob; Grefenstette, Edward; Whiteson, Shimon; Rocktäschel, Tim
Publié dans: Numéro 1, 2019
Éditeur: IJCAI

Mean-Variance Policy Iteration for Risk-Averse Reinforcement Learning

Auteurs: Zhang, Shangtong; Liu, Bo; Whiteson, Shimon
Publié dans: Numéro 1, 2021
Éditeur: AAAI

Breaking the Deadly Triad with a Target Network

Auteurs: Zhang, Shangtong; Yao, Hengshuai; Whiteson, Shimon
Publié dans: Numéro 1, 2021
Éditeur: ICML

GradientDICE: Rethinking Generalized Offline Estimation of Stationary Values

Auteurs: Zhang, Shangtong; Liu, Bo; Whiteson, Shimon
Publié dans: Numéro 1, 2020
Éditeur: ICML

UneVEn: Universal Value Exploration for Multi-Agent Reinforcement Learning

Auteurs: Gupta, Tarun; Mahajan, Anuj; Peng, Bei; Böhmer, Wendelin; Whiteson, Shimon
Publié dans: Numéro 1, 2021
Éditeur: ICML

Maximizing Information Gain in Partially Observable Environments via Prediction Reward

Auteurs: Satsangi, Yash; Lim, Sungsu; Whiteson, Shimon; Oliehoek, Frans; White, Martha
Publié dans: Numéro 1, 2020
Éditeur: AAMAS

VIREL: A Variational Inference Framework for Reinforcement Learning

Auteurs: Fellows, Matthew; Mahajan, Anuj; Rudner, Tim G. J.; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: NeurIPS

Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Estimators for Reinforcement Learning

Auteurs: Farquhar, Gregory; Whiteson, Shimon; Foerster, Jakob
Publié dans: Numéro 1, 2019
Éditeur: NeurIPS

Average-Reward Off-Policy Policy Evaluation with Function Approximation

Auteurs: Zhang, Shangtong; Wan, Yi; Sutton, Richard S.; Whiteson, Shimon
Publié dans: Numéro 1, 2021
Éditeur: ICML

Expected Policy Gradients

Auteurs: Kamil Ciosek Shimon Whiteson
Publié dans: 2018
Éditeur: AAAI

Alternating Optimisation and Quadrature for Robust Control

Auteurs: Supratik Paul‚ Konstantinos Chatzilygeroudis‚ Kamil Ciosek‚ Jean−Baptiste Mouret‚ Michael Osborne and Shimon Whiteson
Publié dans: 2018
Éditeur: AAAI

Learning with Opponent−Learning Awareness

Auteurs: Jakob Foerster‚ Richard Chen‚ Maruan Al−Shedivat‚ Shimon Whiteson‚ Pieter Abbeel and Igor Mordatch
Publié dans: 2018
Éditeur: AAMAS

TreeQN and ATreeC: Differentiable Tree−Structured Models for Deep Reinforcement Learning

Auteurs: Gregory Farquhar‚ Tim Rocktaschel‚ Maximilian Igl and Shimon Whiteson
Publié dans: 2018
Éditeur: ICLR

QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

Auteurs: Rashid, Tabish; Samvelyan, Mikayel; de Witt, Christian Schroeder; Farquhar, Gregory; Foerster, Jakob; Whiteson, Shimon
Publié dans: Numéro 2, 2018
Éditeur: ICML

Expected Policy Gradients for Reinforcement Learning

Auteurs: Ciosek, Kamil; Whiteson, Shimon
Publié dans: Numéro 2, 2018
Éditeur: AAAI

TACO: Learning Task Decomposition via Temporal Alignment for Control

Auteurs: Kyriacos Shiarlis‚ Markus Wulfmeier‚ Sasha Salter‚ Shimon Whiteson and Ingmar Posner
Publié dans: 2018
Éditeur: ICML

DiCE: The Infinitely Differentiable Monte-Carlo Estimator

Auteurs: Foerster, Jakob; Farquhar, Gregory; Al-Shedivat, Maruan; Rocktäschel, Tim; Xing, Eric P.; Whiteson, Shimon
Publié dans: Numéro 2, 2018
Éditeur: ICML

Deep Variational Reinforcement Learning for POMDPs

Auteurs: Igl, Maximilian; Zintgraf, Luisa; Le, Tuan Anh; Wood, Frank; Whiteson, Shimon
Publié dans: Numéro 1, 2018
Éditeur: ICML

Fourier Policy Gradients

Auteurs: Matthew Fellows‚ Kamil Ciosek and Shimon Whiteson
Publié dans: 2018
Éditeur: ICML

OFFER: Off−Environment Reinforcement Learning

Auteurs: Kamil Ciosek and Shimon Whiteson
Publié dans: 2017
Éditeur: AAAI

Stabilising Experience Replay for Deep Multi−Agent Reinforcement Learning

Auteurs: Jakob Foerster‚ Nantas Nardelli‚ Greg Farquhar‚ Phil Torr‚ Pushmeet Kohli and Shimon Whiteson
Publié dans: 2017
Éditeur: ICML

Learning to Communicate with Deep Multi−Agent Reinforcement Learning

Auteurs: Jakob Foerster‚ Yannis Assael‚ Nando de Freitas and Shimon Whiteson
Publié dans: 2016
Éditeur: NIPS

Counterfactual Multi-Agent Policy Gradients

Auteurs: Jakob Foerster, Gregory Farquhar, Triantafyllos Afouras, Nantas Nardelli, Shimon Whiteson
Publié dans: 2018
Éditeur: AAAI

Multi-Agent Common Knowledge Reinforcement Learning

Auteurs: de Witt, Christian A. Schroeder; Foerster, Jakob N.; Farquhar, Gregory; Torr, Philip H. S.; Boehmer, Wendelin; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: NeurIPS

Provably Convergent Two-Timescale Off-Policy Actor-Critic with Function Approximation

Auteurs: Zhang, Shangtong; Liu, Bo; Yao, Hengshuai; Whiteson, Shimon
Publié dans: Numéro 1, 2020
Éditeur: ICML

Exploration in Approximate Hyper-State Space for Meta Reinforcement Learning

Auteurs: Zintgraf, Luisa; Feng, Leo; Lu, Cong; Igl, Maximilian; Hartikainen, Kristian; Hofmann, Katja; Whiteson, Shimon
Publié dans: Numéro 1, 2021
Éditeur: ICML

Generalized Off-Policy Actor-Critic

Auteurs: Zhang, Shangtong; Boehmer, Wendelin; Whiteson, Shimon
Publié dans: Numéro 1, 2019
Éditeur: NeurIPS

Deep Residual Reinforcement Learning

Auteurs: Zhang, Shangtong; Boehmer, Wendelin; Whiteson, Shimon
Publié dans: Numéro 1, 2020
Éditeur: AAMAS

Optimistic Exploration even with a Pessimistic Initialisation

Auteurs: Rashid, Tabish; Peng, Bei; Böhmer, Wendelin; Whiteson, Shimon
Publié dans: Numéro 1, 2020
Éditeur: ICLR

Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

Auteurs: Rashid, Tabish; Samvelyan, Mikayel; de Witt, Christian Schroeder; Farquhar, Gregory; Foerster, Jakob; Whiteson, Shimon
Publié dans: JMLR, Numéro 2, 2020, ISSN 1533-7928
Éditeur: JMLR

Robust Reinforcement Learning with Bayesian Optimisation and Quadrature

Auteurs: Paul, Supratik; Chatzilygeroudis, Konstantinos; Ciosek, Kamil; Mouret, Jean-Baptiste; Osborne, Michael,; Whiteson, Shimon
Publié dans: Journal of Machine Learning Research, Microtome Publishing, 2020, 21, pp.1 - 31, Numéro 3, 2020, ISSN 1533-7928
Éditeur: JMLR

Expected Policy Gradients for Reinforcement Learning

Auteurs: Ciosek, Kamil; Whiteson, Shimon
Publié dans: JMLR, Numéro 1, 2020, ISSN 1533-7928
Éditeur: JMLR

Recherche de données OpenAIRE...

Une erreur s’est produite lors de la recherche de données OpenAIRE

Aucun résultat disponible

Mon livret 0 0