European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Goal-directed learning of the statistical structure of the environment

Description du projet

La récompense dans les décisions humaines fondées sur les statistiques

Les humains et autres animaux doivent apprendre à refouler leurs informations sensorielles de manière efficace – guidées par les régularités statistiques de l’environnement et la récompense qu’il offre. De récentes études psychologiques et neuroscientifiques montrent que les signaux de récompense modulent dûment les représentations apprises. Toutefois, ces représentations déterminent comment nous reconnaissons les objets et les concepts, et l’influence indirecte de la récompense sur ces derniers reste obscure. Partant de l’hypothèse que les humains utilisent des ressources statistiques limitées pour orienter les représentations apprises afin de les utiliser pour gagner une récompense, RELEARN propose un modèle mathématique qui intègre un apprentissage par renforcement et un apprentissage par représentation probabiliste. Nous testerons les prédictions comportementales et neuronales dans des expériences où les humains apprennent à gagner une récompense en s’appuyant sur les statistiques caractéristiques d’un environnement simulé.

Objectif

Learning the statistical buildup of the environment serves the purpose of making good decisions, thus what regularities humans learn and what ones they neglect depends on the relevance towards maximizing reward. Recent studies characterise reward-based modulation of feature representations built by humans and animals both on the behavioural and neural level, but the effect of reward on learning higher-order environmental statistics is unknown. Our hypothesis is that humans do not learn to represent feature co-occurrence statistics if it does not help to predict reward due to resource constraints on computation and storage. We propose a mathematical framework based on Bayesian hierarchical modelling and reinforcement learning to predict the modulatory effect of reward on learned representations. We will test the predictions of the model in a series of experiments where humans need to learn to associate precisely controlled statistical aspects of a naturalistic simulated environment to reward both in the lab and online, in reactive and planning-based tasks. Additional to behaviour, the model will predict the structure of neural representations and their changes over the course of the experiment as well. We will test those predictions using magnetoencephalography during the learning phase of the experiments and decoding analysis to compare model variables to neural responses. The results will contribute to the understanding of representational learning in humans, with potential implications in psychiatry and economics as well as supply the community with novel analytical tools and data. The unique mentoring at the host institution together with the extensive training program including international visits to world-leading collaborators will establish my independent research program in computational neuroscience.

Coordinateur

MAX-PLANCK-GESELLSCHAFT ZUR FORDERUNG DER WISSENSCHAFTEN EV
Contribution nette de l'UE
€ 174 806,40
Adresse
HOFGARTENSTRASSE 8
80539 Munchen
Allemagne

Voir sur la carte

Région
Bayern Oberbayern München, Kreisfreie Stadt
Type d’activité
Research Organisations
Liens
Coût total
€ 174 806,40