CORDIS - Forschungsergebnisse der EU
CORDIS

Goal-directed learning of the statistical structure of the environment

Projektbeschreibung

Die Rolle der Belohnung bei statistisch basierten Entscheidungen des Menschen

Menschen und Tiere müssen lernen, die auf sie einströmenden sensorischen Reize effizient zu komprimieren. Dabei lassen sie sich zum einen von den statistischen Regelmäßigkeiten der Umwelt und zum anderen von der durch sie gebotenen Belohnung leiten. Jüngste psychologische und neurowissenschaftliche Studien zeigen, dass Belohnungssignale die erlernten Repräsentationen modulieren. Diese Repräsentationen bestimmen darüber, wie wir Objekte und Konzepte erkennen. Noch ist allerdings unklar, inwieweit Belohnungen darauf indirekt Einfluss nehmen. Das Projekt RELEARN geht von der Hypothese aus, dass Menschen beschränkte Ressourcen für Berechnungsvorgänge darauf verwenden, erlernte Repräsentationen zur Erlangung von Belohnungen einzusetzen, und schlägt basierend darauf ein mathematisches Modell vor, das Verstärkungslernen und probabilistisches Repräsentationslernen integriert. Die Forschenden werden Prognosen zum Verhalten und den neuronalen Antworten in verschiedenen Experimenten testen, bei denen Versuchspersonen Lernvorgänge zu den statistischen Aspekten einer simulierten Umwelt durchlaufen müssen, um Belohnungen zu erhalten.

Ziel

Learning the statistical buildup of the environment serves the purpose of making good decisions, thus what regularities humans learn and what ones they neglect depends on the relevance towards maximizing reward. Recent studies characterise reward-based modulation of feature representations built by humans and animals both on the behavioural and neural level, but the effect of reward on learning higher-order environmental statistics is unknown. Our hypothesis is that humans do not learn to represent feature co-occurrence statistics if it does not help to predict reward due to resource constraints on computation and storage. We propose a mathematical framework based on Bayesian hierarchical modelling and reinforcement learning to predict the modulatory effect of reward on learned representations. We will test the predictions of the model in a series of experiments where humans need to learn to associate precisely controlled statistical aspects of a naturalistic simulated environment to reward both in the lab and online, in reactive and planning-based tasks. Additional to behaviour, the model will predict the structure of neural representations and their changes over the course of the experiment as well. We will test those predictions using magnetoencephalography during the learning phase of the experiments and decoding analysis to compare model variables to neural responses. The results will contribute to the understanding of representational learning in humans, with potential implications in psychiatry and economics as well as supply the community with novel analytical tools and data. The unique mentoring at the host institution together with the extensive training program including international visits to world-leading collaborators will establish my independent research program in computational neuroscience.

Koordinator

MAX-PLANCK-GESELLSCHAFT ZUR FORDERUNG DER WISSENSCHAFTEN EV
Netto-EU-Beitrag
€ 174 806,40
Adresse
HOFGARTENSTRASSE 8
80539 Munchen
Deutschland

Auf der Karte ansehen

Region
Bayern Oberbayern München, Kreisfreie Stadt
Aktivitätstyp
Research Organisations
Links
Gesamtkosten
€ 174 806,40