Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

De meilleures décisions par renforcement de l'apprentissage

Une étude sur la consolidation de l'apprentissage nous apporte de nouvelles perspectives quant au processus décisionnel des adolescents basé sur le renforcement.
De meilleures décisions par renforcement de l'apprentissage
La prise de décision s'appuie en effet sur l'interaction de plusieurs processus dont ceux de la représentation des valeurs, de la sélection d'une réponse et de l'apprentissage. Pendant l'adolescence, ces prises de décisions se caractérisent souvent par une forte impulsivité et une prise de risques qui peuvent avoir des conséquences graves pour le jeune adulte. Le renforcement de l'apprentissage permet d'intégrer ces processus. Il a pour but d'apprendre à améliorer les futurs choix d'un individu afin de maximiser la survenue d'évènements agréables (récompenses) et de minimiser la survenue d'évènements désagréables (punitions).

La compréhension du processus qui sous-tend la prise de décision pendant la période de l'adolescence est donc essentielle, pourtant le développement de l'apprentissage par renforcement n'a été étudié que récemment. Le projet DEVELOP-LEARNING (Developmental trajectories for model-free and model-based reinforcement learning: Computational and neural bases) est un projet financé par l'UE pour justement changer cette situation en menant des expériences comportementales.

La première expérience assignait une nouvelle tâche d'apprentissage fondamental impliquant récompenses et punitions classiques à plusieurs adultes et adolescents, ainsi qu'un apprentissage contradictoire par des informations fictives. Les chercheurs ont montré que la performance des adolescents n'était pas significativement améliorée par des informations contradictoires; et que, comparé aux adultes, les adolescents apprenaient mieux par un apprentissage basé sur la récompense que celui basé sur un système punitif, alors que les adultes ne montraient pas de préférence pour l'un ou l'autre système.

Ces résultats montrent qu'adultes et adolescents n'utilisent pas le même algorithme pour résoudre une tâche d'apprentissage. Et que, contrairement aux adultes, la performance des adolescents ne considère pas les informations contrefactuelles. Les adolescents ont de plus montré qu'ils apprenaient en recherchant la récompense plutôt qu'en évitant la punition. Les adultes par contre apprenaient tant pour la récompense que pour éviter la punition.

Une meilleure connaissance des modifications d'analyse lors du renforcement de l'apprentissage des adolescents pourrait nous fournir des indications précieuses quant aux valeurs utilisées par le jeune adulte pour prendre sa décision. Ces travaux pourront également avoir un impact sur l'éducation car ils suggèrent que les adolescents profitent davantage d'un retour positif lors de l'exécution d'une tâche d'apprentissage.

Informations connexes

Mots-clés

Apprentissage par récompense, adolescence, prise de décision, DEVELOP-LEARNING, apprentissage contrefactuel, apprentissage punitif