Skip to main content
Un sito ufficiale dell’Unione europeaUn sito ufficiale dell’UE
European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Coevolutionary Policy Search

CORDIS fornisce collegamenti ai risultati finali pubblici e alle pubblicazioni dei progetti ORIZZONTE.

I link ai risultati e alle pubblicazioni dei progetti del 7° PQ, così come i link ad alcuni tipi di risultati specifici come dataset e software, sono recuperati dinamicamente da .OpenAIRE .

Pubblicazioni

Alternating Optimisation and Quadrature for Robust Control

Autori: Paul, Supratik; Chatzilygeroudis, Konstantinos; Ciosek, Kamil; Mouret, Jean-Baptiste; Osborne, Michael A.; Whiteson, Shimon
Pubblicato in: AAAI 2018 - The Thirty-Second AAAI Conference on Artificial Intelligence, Numero 1, 2018
Editore: AAAI

Growing Action Spaces

Autori: Farquhar, Gregory; Gustafson, Laura; Lin, Zeming; Whiteson, Shimon; Usunier, Nicolas; Synnaeve, Gabriel
Pubblicato in: Numero 1, 2020
Editore: ICML

TreeQN and ATreeC: Differentiable Tree-Structured Models for Deep Reinforcement Learning

Autori: Farquhar, Gregory; Rocktäschel, Tim; Igl, Maximilian; Whiteson, Shimon
Pubblicato in: Numero 1, 2018
Editore: ICLR

DAC: The Double Actor-Critic Architecture for Learning Options

Autori: Zhang, Shangtong; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: NeurIPS

VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning

Autori: Zintgraf, Luisa; Shiarlis, Kyriacos; Igl, Maximilian; Schulze, Sebastian; Gal, Yarin; Hofmann, Katja; Whiteson, Shimon
Pubblicato in: Numero 1, 2020
Editore: ICLR

Fast Context Adaptation via Meta-Learning

Autori: Zintgraf, Luisa M; Shiarlis, Kyriacos; Kurin, Vitaly; Hofmann, Katja; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: ICML

Fingerprint Policy Optimisation for Robust Reinforcement Learning

Autori: Paul, Supratik; Osborne, Michael A.; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: ICML

MAVEN: Multi-Agent Variational Exploration

Autori: Mahajan, Anuj; Rashid, Tabish; Samvelyan, Mikayel; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: NeurIPS

Learning Retrospective Knowledge with Reverse Reinforcement Learning

Autori: Zhang, Shangtong; Veeriah, Vivek; Whiteson, Shimon
Pubblicato in: Numero 1, 2020
Editore: NeurIPS

Fast Efficient Hyperparameter Tuning for Policy Gradients

Autori: Paul, Supratik; Kurin, Vitaly; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: NeurIPS

A Survey of Reinforcement Learning Informed by Natural Language

Autori: Luketina, Jelena; Nardelli, Nantas; Farquhar, Gregory; Foerster, Jakob; Andreas, Jacob; Grefenstette, Edward; Whiteson, Shimon; Rocktäschel, Tim
Pubblicato in: Numero 1, 2019
Editore: IJCAI

Mean-Variance Policy Iteration for Risk-Averse Reinforcement Learning

Autori: Zhang, Shangtong; Liu, Bo; Whiteson, Shimon
Pubblicato in: Numero 1, 2021
Editore: AAAI

Breaking the Deadly Triad with a Target Network

Autori: Zhang, Shangtong; Yao, Hengshuai; Whiteson, Shimon
Pubblicato in: Numero 1, 2021
Editore: ICML

GradientDICE: Rethinking Generalized Offline Estimation of Stationary Values

Autori: Zhang, Shangtong; Liu, Bo; Whiteson, Shimon
Pubblicato in: Numero 1, 2020
Editore: ICML

UneVEn: Universal Value Exploration for Multi-Agent Reinforcement Learning

Autori: Gupta, Tarun; Mahajan, Anuj; Peng, Bei; Böhmer, Wendelin; Whiteson, Shimon
Pubblicato in: Numero 1, 2021
Editore: ICML

Maximizing Information Gain in Partially Observable Environments via Prediction Reward

Autori: Satsangi, Yash; Lim, Sungsu; Whiteson, Shimon; Oliehoek, Frans; White, Martha
Pubblicato in: Numero 1, 2020
Editore: AAMAS

VIREL: A Variational Inference Framework for Reinforcement Learning

Autori: Fellows, Matthew; Mahajan, Anuj; Rudner, Tim G. J.; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: NeurIPS

Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Estimators for Reinforcement Learning

Autori: Farquhar, Gregory; Whiteson, Shimon; Foerster, Jakob
Pubblicato in: Numero 1, 2019
Editore: NeurIPS

Average-Reward Off-Policy Policy Evaluation with Function Approximation

Autori: Zhang, Shangtong; Wan, Yi; Sutton, Richard S.; Whiteson, Shimon
Pubblicato in: Numero 1, 2021
Editore: ICML

Expected Policy Gradients

Autori: Kamil Ciosek Shimon Whiteson
Pubblicato in: 2018
Editore: AAAI

Alternating Optimisation and Quadrature for Robust Control

Autori: Supratik Paul‚ Konstantinos Chatzilygeroudis‚ Kamil Ciosek‚ Jean−Baptiste Mouret‚ Michael Osborne and Shimon Whiteson
Pubblicato in: 2018
Editore: AAAI

Learning with Opponent−Learning Awareness

Autori: Jakob Foerster‚ Richard Chen‚ Maruan Al−Shedivat‚ Shimon Whiteson‚ Pieter Abbeel and Igor Mordatch
Pubblicato in: 2018
Editore: AAMAS

TreeQN and ATreeC: Differentiable Tree−Structured Models for Deep Reinforcement Learning

Autori: Gregory Farquhar‚ Tim Rocktaschel‚ Maximilian Igl and Shimon Whiteson
Pubblicato in: 2018
Editore: ICLR

QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

Autori: Rashid, Tabish; Samvelyan, Mikayel; de Witt, Christian Schroeder; Farquhar, Gregory; Foerster, Jakob; Whiteson, Shimon
Pubblicato in: Numero 2, 2018
Editore: ICML

Expected Policy Gradients for Reinforcement Learning

Autori: Ciosek, Kamil; Whiteson, Shimon
Pubblicato in: Numero 2, 2018
Editore: AAAI

TACO: Learning Task Decomposition via Temporal Alignment for Control

Autori: Kyriacos Shiarlis‚ Markus Wulfmeier‚ Sasha Salter‚ Shimon Whiteson and Ingmar Posner
Pubblicato in: 2018
Editore: ICML

DiCE: The Infinitely Differentiable Monte-Carlo Estimator

Autori: Foerster, Jakob; Farquhar, Gregory; Al-Shedivat, Maruan; Rocktäschel, Tim; Xing, Eric P.; Whiteson, Shimon
Pubblicato in: Numero 2, 2018
Editore: ICML

Deep Variational Reinforcement Learning for POMDPs

Autori: Igl, Maximilian; Zintgraf, Luisa; Le, Tuan Anh; Wood, Frank; Whiteson, Shimon
Pubblicato in: Numero 1, 2018
Editore: ICML

Fourier Policy Gradients

Autori: Matthew Fellows‚ Kamil Ciosek and Shimon Whiteson
Pubblicato in: 2018
Editore: ICML

OFFER: Off−Environment Reinforcement Learning

Autori: Kamil Ciosek and Shimon Whiteson
Pubblicato in: 2017
Editore: AAAI

Stabilising Experience Replay for Deep Multi−Agent Reinforcement Learning

Autori: Jakob Foerster‚ Nantas Nardelli‚ Greg Farquhar‚ Phil Torr‚ Pushmeet Kohli and Shimon Whiteson
Pubblicato in: 2017
Editore: ICML

Learning to Communicate with Deep Multi−Agent Reinforcement Learning

Autori: Jakob Foerster‚ Yannis Assael‚ Nando de Freitas and Shimon Whiteson
Pubblicato in: 2016
Editore: NIPS

Counterfactual Multi-Agent Policy Gradients

Autori: Jakob Foerster, Gregory Farquhar, Triantafyllos Afouras, Nantas Nardelli, Shimon Whiteson
Pubblicato in: 2018
Editore: AAAI

Multi-Agent Common Knowledge Reinforcement Learning

Autori: de Witt, Christian A. Schroeder; Foerster, Jakob N.; Farquhar, Gregory; Torr, Philip H. S.; Boehmer, Wendelin; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: NeurIPS

Provably Convergent Two-Timescale Off-Policy Actor-Critic with Function Approximation

Autori: Zhang, Shangtong; Liu, Bo; Yao, Hengshuai; Whiteson, Shimon
Pubblicato in: Numero 1, 2020
Editore: ICML

Exploration in Approximate Hyper-State Space for Meta Reinforcement Learning

Autori: Zintgraf, Luisa; Feng, Leo; Lu, Cong; Igl, Maximilian; Hartikainen, Kristian; Hofmann, Katja; Whiteson, Shimon
Pubblicato in: Numero 1, 2021
Editore: ICML

Generalized Off-Policy Actor-Critic

Autori: Zhang, Shangtong; Boehmer, Wendelin; Whiteson, Shimon
Pubblicato in: Numero 1, 2019
Editore: NeurIPS

Deep Residual Reinforcement Learning

Autori: Zhang, Shangtong; Boehmer, Wendelin; Whiteson, Shimon
Pubblicato in: Numero 1, 2020
Editore: AAMAS

Optimistic Exploration even with a Pessimistic Initialisation

Autori: Rashid, Tabish; Peng, Bei; Böhmer, Wendelin; Whiteson, Shimon
Pubblicato in: Numero 1, 2020
Editore: ICLR

Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

Autori: Rashid, Tabish; Samvelyan, Mikayel; de Witt, Christian Schroeder; Farquhar, Gregory; Foerster, Jakob; Whiteson, Shimon
Pubblicato in: JMLR, Numero 2, 2020, ISSN 1533-7928
Editore: JMLR

Robust Reinforcement Learning with Bayesian Optimisation and Quadrature

Autori: Paul, Supratik; Chatzilygeroudis, Konstantinos; Ciosek, Kamil; Mouret, Jean-Baptiste; Osborne, Michael,; Whiteson, Shimon
Pubblicato in: Journal of Machine Learning Research, Microtome Publishing, 2020, 21, pp.1 - 31, Numero 3, 2020, ISSN 1533-7928
Editore: JMLR

Expected Policy Gradients for Reinforcement Learning

Autori: Ciosek, Kamil; Whiteson, Shimon
Pubblicato in: JMLR, Numero 1, 2020, ISSN 1533-7928
Editore: JMLR

Altri prodotti di ricerca

A Baseline for Any Order Gradient Estimation in Stochastic Computation Graphs

Autori: Mao, J; Foerster, J; Rocktäschel, T; Al-Shedivat, M; Farquhar, G; Whiteson, S

Stable Opponent Shaping in Differentiable Games

Autori: Letcher, A; Foerster, J; Balduzzi, D; Rocktäschel, T; Whiteson, S

My Body is a Cage: the Role of Morphology in Graph-Based Incompatible Control

Autori: Kurin, V; Igl, M; Rocktäschel, T; Boehmer, W; Whiteson, S

TreeqN and ATreEC: Differentiable tree-structured models for deep reinforcement learning

Autori: Farquhar, G; Rocktäschel, T; Igl, M; Whiteson, S

DiCE: The Infinitely Differentiable Monte-Carlo Estimator

Autori: Foerster, J; Farquhar, G; Al-Shedivat, M; Rocktäschel, T; Xing, EP; Whiteson, S

Si è verificato un errore durante la ricerca dei dati su OpenAIRE

Nessun risultato disponibile