Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Characterizing information integration in reinforcement learning: a neuro-computational investigation

Description du projet

Construction d’un modèle neuro‑informatique d’intégration de l’information

Les caractéristiques comportementales, informatiques et neurobiologiques de l’apprentissage à partir de résultats expérimentés singuliers ont fait l’objet d’études poussées. Ce n’est pas le cas de l’apprentissage renforcé, qui est défini par la manière dont nous apprenons de manière adaptative, par essais et erreurs, et par récompenses et punitions. Dans ce contexte, le projet INFORL, financé par le CER, explorera la manière dont les personnes hiérarchisent, filtrent ou valorisent les informations sur les résultats dans l’apprentissage renforcé. Son hypothèse de travail est que, même si les personnes peuvent apprendre à partir de plusieurs échantillons d’informations simultanées, les limitations informatiques et les biais affectifs minimisent l’intégration des informations. Des modalités de suivi oculaire et de neuro-imagerie fonctionnelle seront utilisées pour construire un modèle neuro‑informatique d’intégration des informations. Les résultats feront la lumière sur le processus d’apprentissage et les caractéristiques inadaptées du comportement humain.

Objectif

Reinforcement learning (RL) characterizes how we adaptively learn, by trial and errors, to select actions that maximize the occurrence of rewards, and minimize the occurrence of punishments. While the behavioural, computational and neurobiological features of learning from singular experienced outcomes have been extensively studied, the mechanisms by which RL could leverage multiple, concurrent information samples – including abstract information about prospective outcomes – have been largely overlooked.
As a consequence, little is known about how we prioritize, filter or value outcome information in RL, while these processes likely critically contribute to shaping learning behaviour.
This project proposes to address this gap, and hypothesizes that humans can learn from multiple concurrent information samples, but that computational limitations and affective biases curb information integration.
First, using a new experimental and computational framework, I will evidence and quantify these cognitive features. Using eye-tracking and complementary functional neuroimaging modalities (EEG, fMRI), I will build a neuro-computational model of information integration, by deciphering the interactions between attentional parieto-frontal network and the affective ventro-limbic networks during reinforcement learning.
Then, I propose to investigate the strategic modulation of information integration, by investigating the effects of information quantity and quality on learning strategies and on the neural correlates of learning variables.
Finally, I will assess several behavioural interventions to ameliorate information integration and improve learning performance.
By investigating an overlooked aspect of reinforcement learning –the integration of available information–, this project could not only help refine computational and neurobiological models of the learning process, but also shed new lights on maladaptive traits of human behaviour in social and clinical contexts.

Régime de financement

ERC-STG - Starting Grant

Institution d’accueil

ECOLE D'ECONOMIE DE PARIS
Contribution nette de l'UE
€ 1 272 200,00
Coût total
€ 1 272 200,00

Bénéficiaires (2)