De meilleures décisions par renforcement de l'apprentissage

Une étude sur la consolidation de l'apprentissage nous apporte de nouvelles perspectives quant au processus décisionnel des adolescents basé sur le renforcement.

Changement climatique et Environnement

La prise de décision s'appuie en effet sur l'interaction de plusieurs processus dont ceux de la représentation des valeurs, de la sélection d'une réponse et de l'apprentissage. Pendant l'adolescence, ces prises de décisions se caractérisent souvent par une forte impulsivité et une prise de risques qui peuvent avoir des conséquences graves pour le jeune adulte. Le renforcement de l'apprentissage permet d'intégrer ces processus. Il a pour but d'apprendre à améliorer les futurs choix d'un individu afin de maximiser la survenue d'évènements agréables (récompenses) et de minimiser la survenue d'évènements désagréables (punitions). La compréhension du processus qui sous-tend la prise de décision pendant la période de l'adolescence est donc essentielle, pourtant le développement de l'apprentissage par renforcement n'a été étudié que récemment. Le projet DEVELOP-LEARNING (Developmental trajectories for model-free and model-based reinforcement learning: Computational and neural bases) est un projet financé par l'UE pour justement changer cette situation en menant des expériences comportementales. La première expérience assignait une nouvelle tâche d'apprentissage fondamental impliquant récompenses et punitions classiques à plusieurs adultes et adolescents, ainsi qu'un apprentissage contradictoire par des informations fictives. Les chercheurs ont montré que la performance des adolescents n'était pas significativement améliorée par des informations contradictoires; et que, comparé aux adultes, les adolescents apprenaient mieux par un apprentissage basé sur la récompense que celui basé sur un système punitif, alors que les adultes ne montraient pas de préférence pour l'un ou l'autre système. Ces résultats montrent qu'adultes et adolescents n'utilisent pas le même algorithme pour résoudre une tâche d'apprentissage. Et que, contrairement aux adultes, la performance des adolescents ne considère pas les informations contrefactuelles. Les adolescents ont de plus montré qu'ils apprenaient en recherchant la récompense plutôt qu'en évitant la punition. Les adultes par contre apprenaient tant pour la récompense que pour éviter la punition. Une meilleure connaissance des modifications d'analyse lors du renforcement de l'apprentissage des adolescents pourrait nous fournir des indications précieuses quant aux valeurs utilisées par le jeune adulte pour prendre sa décision. Ces travaux pourront également avoir un impact sur l'éducation car ils suggèrent que les adolescents profitent davantage d'un retour positif lors de l'exécution d'une tâche d'apprentissage.

Mots‑clés

Découvrir d’autres articles du même domaine d’application

De nouveaux algorithmes facilitent l’utilisation de véhicules sous-marins autonomes adaptatifs

9 Février 2024

Un cadre intersectoriel pour l’élaboration de politiques communes

17 Mars 2026

Informations projet

DEVELOP‐LEARNING

N° de convention de subvention: 328822

Projet clôturé

Date de début 1 Janvier 2014

Date de fin 31 Decembre 2015

Financé au titre de

Specific programme "People" implementing the Seventh Framework Programme of the European Community for research, technological development and demonstration activities (2007 to 2013)

Coût total

€ 231 283,20

Contribution de l’UE

€ 231 283,20

231 283,20

Coordonné par

UNIVERSITY COLLEGE LONDON

Mots‑clés

Découvrir d’autres articles du même domaine d’application

Télécharger Télécharger le contenu de la page