Servizio Comunitario di Informazione in materia di Ricerca e Sviluppo - CORDIS

Decisioni migliori attraverso l’apprendimento per rinforzo

Uno studio sullo sviluppo dell’approfondimento per rinforzo nell’adolescenza ha fornito ulteriori chiarimenti sul processo decisionale degli adolescenti basato sul rinforzo.
Decisioni migliori attraverso l’apprendimento per rinforzo
Il processo decisionale si basa sull’interazione di vari processi, tra cui la rappresentazione del valore, la selezione della risposta e l’apprendimento. Durante l’adolescenza, le decisioni sono spesso caratterizzate da grande impulsività e alto rischio di avere conseguenze gravi. Con l’apprendimento per rinforzo, i processi sono integrati. Si tratta di apprendere a migliorare le scelte future, al fine di massimizzare il verificarsi di eventi piacevoli (ricompensa) e ridurre al minimo gli eventi spiacevoli (punizione).

Comprendere il processo che è alla base del processo decisionale nell’adolescenza è importante, eppure lo sviluppo dell’apprendimento per rinforzo nell’adolescenza è stato studiato solo di recente. DEVELOP-LEARNING (Developmental trajectories for model-free and model-based reinforcement learning: Computational and neural bases) era un progetto finanziato dall’UE concepito per cambiare la situazione conducendo esperimenti comportamentali.

Il primo esperimento riguardava la gestione di un nuovo compito di apprendimento strumentale che prevedeva l’apprendimento per ricompensa e per punizione, nonché l’apprendimento controfattuale (fittizio) di informazioni da parte di adulti e adolescenti. Si è constatato che il rendimento degli adolescenti non era favorito dalle informazioni controfattuali; e che, rispetto agli adulti, gli adolescenti preferivano apprendere per ricompensa piuttosto che per punizione, mentre gli adulti non facevano differenza.

I risultati hanno dimostrato che adulti e adolescenti non usavano lo stesso algoritmo per risolvere i compiti. A differenza degli adulti, il rendimento degli adolescenti non teneva conto delle informazioni controfattuali. Inoltre, gli adolescenti imparavano a cercare ricompense, piuttosto che di evitare le punizioni. Gli adulti, invece, imparavano a cercare ed evitare allo stesso modo.

Una maggiore comprensione dei cambiamenti computazionali nell’apprendimento per rinforzo durante l’adolescenza potrebbe fornire nuove informazioni sul processo decisionale basato sul valore nell’adolescenza. I risultati possono anche avere un impatto sull’educazione, in quanto indicano che gli adolescenti traggono un maggior vantaggio dalla risposta positiva ai loro tentativi di apprendimento.

Informazioni correlate

Keywords

Apprendimento per ricompensa, adolescenza, processo decisionale, DEVELOP-LEARNING, apprendimento controfattuale, apprendimento per punizione