Descrizione del progetto
Ottimizzazione della pianificazione teorica delle decisioni per agenti autonomi
Gli agenti autonomi sono in grado di percepire e agire nell'ambiente circostante per eseguire compiti specifici senza l'intervento umano. Nel prossimo futuro, potrebbero rivelarsi preziosi nelle case, nelle fabbriche, nel commercio elettronico, negli ambienti ad alto rischio e altro ancora. Pertanto, progettare agenti che si comportino in modo affidabile in contesti diversi è una priorità per l'IA. Tuttavia, la sfida principale consiste nel superare gli ostacoli che si frappongono alla formulazione della politica di un agente, come la costosa valutazione politica che richiede molteplici prove. Finanziato dal Consiglio europeo della ricerca, il progetto CoPS intende sviluppare una nuova classe di metodi di pianificazione teorica delle decisioni che ottimizzino contemporaneamente le politiche e il modo in cui vengono valutate. Questo approccio identifica automaticamente gli scenari migliori, riducendo così la necessità di un campionamento casuale.
Obiettivo
I propose to develop a new class of decision-theoretic planning methods that overcome fundamental obstacles to the efficient optimization of autonomous agents. Creating agents that are effective in diverse settings is a key goal of artificial intelligence with enormous potential implications: robotic agents would be invaluable in homes, factories, and high-risk settings; software agents could revolutionize e-commerce, information retrieval, and traffic control.
The main challenge lies in specifying an agent's policy: the behavioral strategy that determines its actions. Since the complexity of realistic tasks makes manual policy construction hopeless, there is great demand for decision-theoretic planning methods that automatically discover good policies. Despite enormous progress, the grand challenge of efficiently discovering effective policies for complex tasks remains unmet.
A fundamental obstacle is the cost of policy evaluation: estimating a policy's quality by averaging performance over multiple trials. This cost grows quickly with increases in task complexity (making trials more expensive) or stochasticity (necessitating more trials).
To address this difficulty, I propose a new approach that simultaneously optimizes both policies and the manner in which those policies are evaluated. The key insight is that, in many tasks, many trials are wasted because they do not elicit the controllable rare events critical for distinguishing between policies. Thus, I will develop methods that leverage coevolution to automatically discover the best events, instead of sampling them randomly.
If successful, this project will greatly improve the efficiency of decision-theoretic planning and, in turn, help realize the potential of autonomous agents. In addition, by automatically identifying the most useful events, the resulting methods will help isolate critical factors in performance and thus yield new insights into what makes decision-theoretic problems hard.
Campo scientifico (EuroSciVoc)
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
- scienze naturaliinformatica e scienze dell'informazionesoftware
- scienze naturalimatematicamatematica applicatastatistica e probabilitàstatistica bayesiana
- scienze naturalimatematicamatematica puraanalisi matematicaanalisi di fourier
- scienze naturaliinformatica e scienze dell'informazioneintelligenza artificialeapprendimento automaticoapprendimento per rinforzo
- scienze naturaliscienze biologichebiologia evoluzionistica
È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione
Programma(i)
Argomento(i)
Invito a presentare proposte
(si apre in una nuova finestra) ERC-2014-STG
Vedi altri progetti per questo bandoMeccanismo di finanziamento
ERC-STG - Starting GrantIstituzione ospitante
OX1 2JD Oxford
Regno Unito