Coevolutionary Policy Search

Informations projet

CoPS

N° de convention de subvention: 637713

Site Web du projet

DOI

10.3030/637713

Projet clôturé

Date de signature de la CE 2 Juin 2015

Date de début 1 Octobre 2015

Date de fin 30 Septembre 2021

Financé au titre de

EXCELLENT SCIENCE - European Research Council (ERC)

Coût total

€ 1 480 632,00

Contribution de l’UE

€ 1 480 632,00

1 480 632,00

Coordonné par

THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD
United Kingdom

Description du projet

Optimisation de la planification en théorie de la décision pour les agents autonomes

Les agents autonomes peuvent détecter et agir dans leur environnement pour effectuer des tâches déterminées sans intervention humaine. Dans un avenir proche, ils pourraient s’avérer inestimables dans les maisons, les usines, le commerce électronique, les environnements à haut risque, etc. Par conséquent, la conception d’agents qui fonctionnent de manière fiable dans divers environnements est une priorité pour le secteur de l’IA. Toutefois, le principal défi consiste à surmonter les obstacles à la formulation de la politique d’un agent, tels que l’évaluation coûteuse de la politique nécessitant de multiples essais. Financé par le Conseil européen de la recherche, le projet CoPS entend mettre au point une nouvelle catégorie de méthodes de planification fondées sur la théorie de la décision qui optimisent simultanément les politiques et la manière dont elles sont évaluées. Cette approche identifie automatiquement les meilleurs scénarios, réduisant ainsi la nécessité d’un échantillonnage aléatoire.

Objectif

I propose to develop a new class of decision-theoretic planning methods that overcome fundamental obstacles to the efficient optimization of autonomous agents. Creating agents that are effective in diverse settings is a key goal of artificial intelligence with enormous potential implications: robotic agents would be invaluable in homes, factories, and high-risk settings; software agents could revolutionize e-commerce, information retrieval, and traffic control.
The main challenge lies in specifying an agent's policy: the behavioral strategy that determines its actions. Since the complexity of realistic tasks makes manual policy construction hopeless, there is great demand for decision-theoretic planning methods that automatically discover good policies. Despite enormous progress, the grand challenge of efficiently discovering effective policies for complex tasks remains unmet.
A fundamental obstacle is the cost of policy evaluation: estimating a policy's quality by averaging performance over multiple trials. This cost grows quickly with increases in task complexity (making trials more expensive) or stochasticity (necessitating more trials).
To address this difficulty, I propose a new approach that simultaneously optimizes both policies and the manner in which those policies are evaluated. The key insight is that, in many tasks, many trials are wasted because they do not elicit the controllable rare events critical for distinguishing between policies. Thus, I will develop methods that leverage coevolution to automatically discover the best events, instead of sampling them randomly.
If successful, this project will greatly improve the efficiency of decision-theoretic planning and, in turn, help realize the potential of autonomous agents. In addition, by automatically identifying the most useful events, the resulting methods will help isolate critical factors in performance and thus yield new insights into what makes decision-theoretic problems hard.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

H2020-EU.1.1. - EXCELLENT SCIENCE - European Research Council (ERC) PROGRAMME PRINCIPAL
Voir tous les projets financés dans le cadre de ce programme

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

ERC-StG-2014 - ERC Starting Grant
Voir tous les projets financés dans ce domaine

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

ERC-STG - Starting Grant

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) ERC-2014-STG

Voir tous les projets financés au titre de cet appel

Institution d’accueil

THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD

Contribution nette de l'UE

€ 1 480 632,00

Adresse

WELLINGTON SQUARE UNIVERSITY OFFICES
OX1 2JD Oxford
Royaume-Uni

Région

South East (England) Berkshire, Buckinghamshire and Oxfordshire Oxfordshire

Type d’activité

Higher or Secondary Education Establishments

Liens

Contacter l’organisation Site web

Participation aux programmes de R&I de l'UE

Réseau de collaboration HORIZON

Coût total

€ 1 480 632,00

Bénéficiaires (1)

THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD

Royaume-Uni

Contribution nette de l'UE

€ 1 480 632,00

Description du projet

Optimisation de la planification en théorie de la décision pour les agents autonomes

Objectif

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

Institution d’accueil

Bénéficiaires (1)

Partager cette page Partager cette page sur les réseaux sociaux

Télécharger Télécharger le contenu de la page

Coevolutionary Policy Search

Description du projet

Optimisation de la planification en théorie de la décision pour les agents autonomes

Objectif

Champ scientifique (EuroSciVoc) CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Programme(s) Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s) Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

Institution d’accueil

Bénéficiaires (1)

Partager cette page Partager cette page sur les réseaux sociaux

Télécharger Télécharger le contenu de la page

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.