Coevolutionary Policy Search

Información del proyecto

CoPS

Identificador del acuerdo de subvención: 637713

DOI

10.3030/637713

Proyecto cerrado

Fecha de la firma de la CE 2 Junio 2015

Fecha de inicio 1 Octubre 2015

Fecha de finalización 30 Septiembre 2021

Financiado con arreglo a

EXCELLENT SCIENCE - European Research Council (ERC)

Coste total

€ 1 480 632,00

Aportación de la UE

€ 1 480 632,00

1 480 632,00

Coordinado por

THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD
United Kingdom

CORDIS proporciona enlaces a los documentos públicos y las publicaciones de los proyectos de los programas marco HORIZONTE.

Los enlaces a los documentos y las publicaciones de los proyectos del Séptimo Programa Marco, así como los enlaces a algunos tipos de resultados específicos, como conjuntos de datos y «software», se obtienen dinámicamente de OpenAIRE .

Publicaciones

Alternating Optimisation and Quadrature for Robust Control

Autores: Paul, Supratik; Chatzilygeroudis, Konstantinos; Ciosek, Kamil; Mouret, Jean-Baptiste; Osborne, Michael A.; Whiteson, Shimon
Publicado en: AAAI 2018 - The Thirty-Second AAAI Conference on Artificial Intelligence, Edición 1, 2018
Editor: AAAI

Growing Action Spaces

Autores: Farquhar, Gregory; Gustafson, Laura; Lin, Zeming; Whiteson, Shimon; Usunier, Nicolas; Synnaeve, Gabriel
Publicado en: Edición 1, 2020
Editor: ICML

TreeQN and ATreeC: Differentiable Tree-Structured Models for Deep Reinforcement Learning

Autores: Farquhar, Gregory; Rocktäschel, Tim; Igl, Maximilian; Whiteson, Shimon
Publicado en: Edición 1, 2018
Editor: ICLR

DAC: The Double Actor-Critic Architecture for Learning Options

Autores: Zhang, Shangtong; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: NeurIPS

VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning

Autores: Zintgraf, Luisa; Shiarlis, Kyriacos; Igl, Maximilian; Schulze, Sebastian; Gal, Yarin; Hofmann, Katja; Whiteson, Shimon
Publicado en: Edición 1, 2020
Editor: ICLR

Fast Context Adaptation via Meta-Learning

Autores: Zintgraf, Luisa M; Shiarlis, Kyriacos; Kurin, Vitaly; Hofmann, Katja; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: ICML

Fingerprint Policy Optimisation for Robust Reinforcement Learning

Autores: Paul, Supratik; Osborne, Michael A.; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: ICML

MAVEN: Multi-Agent Variational Exploration

Autores: Mahajan, Anuj; Rashid, Tabish; Samvelyan, Mikayel; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: NeurIPS

Learning Retrospective Knowledge with Reverse Reinforcement Learning

Autores: Zhang, Shangtong; Veeriah, Vivek; Whiteson, Shimon
Publicado en: Edición 1, 2020
Editor: NeurIPS

Fast Efficient Hyperparameter Tuning for Policy Gradients

Autores: Paul, Supratik; Kurin, Vitaly; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: NeurIPS

A Survey of Reinforcement Learning Informed by Natural Language

Autores: Luketina, Jelena; Nardelli, Nantas; Farquhar, Gregory; Foerster, Jakob; Andreas, Jacob; Grefenstette, Edward; Whiteson, Shimon; Rocktäschel, Tim
Publicado en: Edición 1, 2019
Editor: IJCAI

Mean-Variance Policy Iteration for Risk-Averse Reinforcement Learning

Autores: Zhang, Shangtong; Liu, Bo; Whiteson, Shimon
Publicado en: Edición 1, 2021
Editor: AAAI

Breaking the Deadly Triad with a Target Network

Autores: Zhang, Shangtong; Yao, Hengshuai; Whiteson, Shimon
Publicado en: Edición 1, 2021
Editor: ICML

GradientDICE: Rethinking Generalized Offline Estimation of Stationary Values

Autores: Zhang, Shangtong; Liu, Bo; Whiteson, Shimon
Publicado en: Edición 1, 2020
Editor: ICML

UneVEn: Universal Value Exploration for Multi-Agent Reinforcement Learning

Autores: Gupta, Tarun; Mahajan, Anuj; Peng, Bei; Böhmer, Wendelin; Whiteson, Shimon
Publicado en: Edición 1, 2021
Editor: ICML

Maximizing Information Gain in Partially Observable Environments via Prediction Reward

Autores: Satsangi, Yash; Lim, Sungsu; Whiteson, Shimon; Oliehoek, Frans; White, Martha
Publicado en: Edición 1, 2020
Editor: AAMAS

VIREL: A Variational Inference Framework for Reinforcement Learning

Autores: Fellows, Matthew; Mahajan, Anuj; Rudner, Tim G. J.; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: NeurIPS

Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Estimators for Reinforcement Learning

Autores: Farquhar, Gregory; Whiteson, Shimon; Foerster, Jakob
Publicado en: Edición 1, 2019
Editor: NeurIPS

Average-Reward Off-Policy Policy Evaluation with Function Approximation

Autores: Zhang, Shangtong; Wan, Yi; Sutton, Richard S.; Whiteson, Shimon
Publicado en: Edición 1, 2021
Editor: ICML

Expected Policy Gradients

Autores: Kamil Ciosek Shimon Whiteson
Publicado en: 2018
Editor: AAAI

Alternating Optimisation and Quadrature for Robust Control

Autores: Supratik Paul‚ Konstantinos Chatzilygeroudis‚ Kamil Ciosek‚ Jean−Baptiste Mouret‚ Michael Osborne and Shimon Whiteson
Publicado en: 2018
Editor: AAAI

Learning with Opponent−Learning Awareness

Autores: Jakob Foerster‚ Richard Chen‚ Maruan Al−Shedivat‚ Shimon Whiteson‚ Pieter Abbeel and Igor Mordatch
Publicado en: 2018
Editor: AAMAS

TreeQN and ATreeC: Differentiable Tree−Structured Models for Deep Reinforcement Learning

Autores: Gregory Farquhar‚ Tim Rocktaschel‚ Maximilian Igl and Shimon Whiteson
Publicado en: 2018
Editor: ICLR

QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

Autores: Rashid, Tabish; Samvelyan, Mikayel; de Witt, Christian Schroeder; Farquhar, Gregory; Foerster, Jakob; Whiteson, Shimon
Publicado en: Edición 2, 2018
Editor: ICML

Expected Policy Gradients for Reinforcement Learning

Autores: Ciosek, Kamil; Whiteson, Shimon
Publicado en: Edición 2, 2018
Editor: AAAI

TACO: Learning Task Decomposition via Temporal Alignment for Control

Autores: Kyriacos Shiarlis‚ Markus Wulfmeier‚ Sasha Salter‚ Shimon Whiteson and Ingmar Posner
Publicado en: 2018
Editor: ICML

DiCE: The Infinitely Differentiable Monte-Carlo Estimator

Autores: Foerster, Jakob; Farquhar, Gregory; Al-Shedivat, Maruan; Rocktäschel, Tim; Xing, Eric P.; Whiteson, Shimon
Publicado en: Edición 2, 2018
Editor: ICML

Deep Variational Reinforcement Learning for POMDPs

Autores: Igl, Maximilian; Zintgraf, Luisa; Le, Tuan Anh; Wood, Frank; Whiteson, Shimon
Publicado en: Edición 1, 2018
Editor: ICML

Fourier Policy Gradients

Autores: Matthew Fellows‚ Kamil Ciosek and Shimon Whiteson
Publicado en: 2018
Editor: ICML

OFFER: Off−Environment Reinforcement Learning

Autores: Kamil Ciosek and Shimon Whiteson
Publicado en: 2017
Editor: AAAI

Stabilising Experience Replay for Deep Multi−Agent Reinforcement Learning

Autores: Jakob Foerster‚ Nantas Nardelli‚ Greg Farquhar‚ Phil Torr‚ Pushmeet Kohli and Shimon Whiteson
Publicado en: 2017
Editor: ICML

Learning to Communicate with Deep Multi−Agent Reinforcement Learning

Autores: Jakob Foerster‚ Yannis Assael‚ Nando de Freitas and Shimon Whiteson
Publicado en: 2016
Editor: NIPS

Counterfactual Multi-Agent Policy Gradients

Autores: Jakob Foerster, Gregory Farquhar, Triantafyllos Afouras, Nantas Nardelli, Shimon Whiteson
Publicado en: 2018
Editor: AAAI

Multi-Agent Common Knowledge Reinforcement Learning

Autores: de Witt, Christian A. Schroeder; Foerster, Jakob N.; Farquhar, Gregory; Torr, Philip H. S.; Boehmer, Wendelin; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: NeurIPS

Provably Convergent Two-Timescale Off-Policy Actor-Critic with Function Approximation

Autores: Zhang, Shangtong; Liu, Bo; Yao, Hengshuai; Whiteson, Shimon
Publicado en: Edición 1, 2020
Editor: ICML

Exploration in Approximate Hyper-State Space for Meta Reinforcement Learning

Autores: Zintgraf, Luisa; Feng, Leo; Lu, Cong; Igl, Maximilian; Hartikainen, Kristian; Hofmann, Katja; Whiteson, Shimon
Publicado en: Edición 1, 2021
Editor: ICML

Generalized Off-Policy Actor-Critic

Autores: Zhang, Shangtong; Boehmer, Wendelin; Whiteson, Shimon
Publicado en: Edición 1, 2019
Editor: NeurIPS

Deep Residual Reinforcement Learning

Autores: Zhang, Shangtong; Boehmer, Wendelin; Whiteson, Shimon
Publicado en: Edición 1, 2020
Editor: AAMAS

Optimistic Exploration even with a Pessimistic Initialisation

Autores: Rashid, Tabish; Peng, Bei; Böhmer, Wendelin; Whiteson, Shimon
Publicado en: Edición 1, 2020
Editor: ICLR

Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

Autores: Rashid, Tabish; Samvelyan, Mikayel; de Witt, Christian Schroeder; Farquhar, Gregory; Foerster, Jakob; Whiteson, Shimon
Publicado en: JMLR, Edición 2, 2020, ISSN 1533-7928
Editor: JMLR

Robust Reinforcement Learning with Bayesian Optimisation and Quadrature

Autores: Paul, Supratik; Chatzilygeroudis, Konstantinos; Ciosek, Kamil; Mouret, Jean-Baptiste; Osborne, Michael,; Whiteson, Shimon
Publicado en: Journal of Machine Learning Research, Microtome Publishing, 2020, 21, pp.1 - 31, Edición 3, 2020, ISSN 1533-7928
Editor: JMLR

Expected Policy Gradients for Reinforcement Learning

Autores: Ciosek, Kamil; Whiteson, Shimon
Publicado en: JMLR, Edición 1, 2020, ISSN 1533-7928
Editor: JMLR

Buscando datos de OpenAIRE...

Publicaciones

Descargar Descargar el contenido de la página