Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Decision noise in reward-guided learning amidst option unavailability

Description du projet

La pharmaco-magnétoencéphalographie au service de la variabilité comportementale persistante

Dans une nouvelle ville, l’absence d’options de restauration peut affecter notre processus de décision, entraînant des choix aléatoires ou des erreurs d’apprentissage. Les théories existantes sur l’apprentissage guidé par la récompense négligent souvent cette question, alors que les stratégies d’adaptation impliquent généralement d’ajuster les niveaux d’exploration ou les processus d’apprentissage. Toutefois, pour comprendre ces tactiques, il faut aller au-delà des actions manifestes de recherche de preuves et s’intéresser à l’échantillonnage attentionnel dissimulé, un processus complexe principalement étudié par des méthodes de suivi oculaire, ce qui peut limiter la compréhension des nuances subtiles dans les comportements d’échantillonnage dissimulé. Le projet DnReLU, financé par le programme MSCA, propose la pharmaco-magnétoencéphalographie (MEG) pour suivre la focalisation de l’attention. Cette approche permet à la recherche d’aborder la variabilité comportementale persistante à plusieurs échelles, allant de la dynamique des neurotransmetteurs à la modélisation du comportement fondée sur la biophysique.

Objectif

Navigating a new city's dining scene often confronts us with unavailable options, e.g. 'fully booked,' shaping our behavioral variability such as random exploratory choices and learning errors. Existing theories of reward-guided learning typically overlook option unavailability. Hypothesized strategies may vary, from adjusting action stochasticityover-exploration to broadly check alternatives, or under-exploration to quickly latch onto available favoritesto adjusting learning process, e.g. weighing past choices for maximal future rewards, or heuristically inflating the value of busy venues while devaluating others ('busier = better'). A nuanced understanding of these tactics requires a deep dive into information sampling, encompassing not just overt evidence-seeking actions but also covert attentional sampling during value updates in the internal model of the world. These complex sampling patterns, unfolding rapidly over hundreds of milliseconds, have been chiefly studied through eye-tracking that captures overt oculomotor variables, leaving the subtleties of covert sampling unexplored and detailed mechanistic insights elusive. I aim to address this issue across multiple scalesfrom neurotransmitter and neural dynamics to biophysically-grounded modeling of behavior. Using pharmaco-magnetoencephalography (MEG), I will track covert attentional focus across the entire timespan of every single reward-guided decision during learning, in detailed source-localized brain regions, while also perturbing neurochemical systems to establish causal links. This research promises to illuminate longstanding questions, such as why behavioral variability persists despite evolutionary pressures favoring reward-maximizing decisions. The training through this MSCA in circuit-level mechanistic models, imparted by world-leading experts, will complement my existing expertise, and establish me as an independent researcher in the burgeoning field of cognitive computational neuroscience.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Coordinateur

ECOLE NORMALE SUPERIEURE
Contribution nette de l'UE
€ 195 914,88
Coût total
Aucune donnée

Partenaires (1)