Opis projektu
Optymalizacja planowania opartego na teorii decyzji dla autonomicznych agentów
Autonomiczni agenci mogą wyczuwać i działać w swoim środowisku, aby wykonywać wyznaczone zadania bez interwencji człowieka. W przewidywalnej przyszłości mogą okazać się nieocenieni m.in. w domach, fabrykach, handlu elektronicznym, środowiskach wysokiego ryzyka. Dlatego też priorytetem dla sztucznej inteligencji jest projektowanie agentów, którzy będą działać niezawodnie w różnych warunkach. Głównym wyzwaniem jest jednak pokonanie barier w formułowaniu polityki agenta, takich jak kosztowna ocena polityki, która wymaga wielu prób. Projekt CoPS, finansowany przez Europejską Radę ds. Badań Naukowych, ma na celu opracowanie nowej klasy metod planowania opartych na teorii decyzji, które jednocześnie optymalizowałoby politykę i sposób jej oceny. Podejście to automatycznie identyfikuje najlepsze scenariusze, zmniejszając tym samym potrzebę doboru losowego.
Cel
I propose to develop a new class of decision-theoretic planning methods that overcome fundamental obstacles to the efficient optimization of autonomous agents. Creating agents that are effective in diverse settings is a key goal of artificial intelligence with enormous potential implications: robotic agents would be invaluable in homes, factories, and high-risk settings; software agents could revolutionize e-commerce, information retrieval, and traffic control.
The main challenge lies in specifying an agent's policy: the behavioral strategy that determines its actions. Since the complexity of realistic tasks makes manual policy construction hopeless, there is great demand for decision-theoretic planning methods that automatically discover good policies. Despite enormous progress, the grand challenge of efficiently discovering effective policies for complex tasks remains unmet.
A fundamental obstacle is the cost of policy evaluation: estimating a policy's quality by averaging performance over multiple trials. This cost grows quickly with increases in task complexity (making trials more expensive) or stochasticity (necessitating more trials).
To address this difficulty, I propose a new approach that simultaneously optimizes both policies and the manner in which those policies are evaluated. The key insight is that, in many tasks, many trials are wasted because they do not elicit the controllable rare events critical for distinguishing between policies. Thus, I will develop methods that leverage coevolution to automatically discover the best events, instead of sampling them randomly.
If successful, this project will greatly improve the efficiency of decision-theoretic planning and, in turn, help realize the potential of autonomous agents. In addition, by automatically identifying the most useful events, the resulting methods will help isolate critical factors in performance and thus yield new insights into what makes decision-theoretic problems hard.
Dziedzina nauki (EuroSciVoc)
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
- nauki przyrodniczeinformatykaoprogramowanie
- nauki przyrodniczematematykamatematyka stosowanastatystyka i rachunek prawdopodobieństwastatystyka bayesowska
- nauki przyrodniczematematykamatematyka czystaanaliza matematycznaanaliza Fouriera
- nauki przyrodniczeinformatykasztuczna inteligencjauczenie maszynoweuczenie przez wzmocnienie
- nauki przyrodniczenauki biologicznebiologia ewolucyjna
Aby użyć tej funkcji, musisz się zalogować lub zarejestrować
Program(-y)
Temat(-y)
System finansowania
ERC-STG - Starting GrantInstytucja przyjmująca
OX1 2JD Oxford
Zjednoczone Królestwo