Bessere Entscheidungen durch bestärkendes Lernen
Die Entscheidungsfindung stützt sich auf das Wechselspiel mehrerer Prozesse einschließlich Wertdarstellung, Reaktionsauswahl und Lernen. Im Jugendalter können Entscheidungen oftmals als impulsiv und hochrisikoreich mit schwerwiegenden Folgen charakterisiert werden. Mit Hilfe von bestärkendem Lernen werden diese Prozesse verknüpft. Es befasst sich mit dem Lernen im Sinne der Verbesserung zukünftiger Entscheidungen eines Einzelnen, um das Auftreten von angenehmen Ereignissen (Belohnungen) zu maximieren und das Auftreten von unangenehmen Ereignissen (Strafen) zu minimieren. Den Prozess zu verstehen, welcher der Entscheidungsfindung im Jugendalter zugrundeliegt, ist wichtig, aber die Herausbildung des bestärkenden Lernens im Jugendalter des Menschen ist erst in jüngster Zeit untersucht worden. DEVELOP-LEARNING (Developmental trajectories for model-free and model-based reinforcement learning: Computational and neural bases) war ein von der EU finanziertes Projekt, das sich dem Ziel widmete, hier mit der Durchführung von Verhaltensexperimenten weiterzukommen. Das erste Experiment umfasste die Durchführung einer neuartigen instrumentellen Lernaufgabe mit grundlegendem Lernen durch Belohnung und Bestrafung, sowie Lernen aus kontrafaktischen (fiktiven) Informationen bei Erwachsenen und Jugendlichen. Man stellte fest, dass die Leistungsfähigkeit der Jugendlichen durch kontrafaktische Informationen nicht erweitert wurde, und die Jugendlichen im Vergleich zu den Erwachsenen bevorzugt durch Belohnung im Vergleich zu Strafe lernten, während Erwachsene auf beide Arten gleichermaßen lernten. Den Resultaten zufolge wandten Erwachsene und Jugendliche nicht den gleichen Algorithmus an, um die Lernaufgabe zu lösen. Anders als die Erwachsenen berücksichtigte das Verhalten der Jugendlichen keine kontrafaktischen Informationen. Des Weiteren lernten die Jugendliche, nach Belohnungen zu suchen, anstelle Strafen zu vermeiden. Erwachsene lernten andererseits, beides gleichermaßen zu suchen und zu vermeiden. Ein gesteigertes Verständnis rechnerischer Veränderungen im bestärkenden Lernen während der Jugend kann uns Einblicke in die wertbasierte Entscheidungsfindung bei Jugendlichen verschaffen. Diese Resultate können überdies potenzielle Auswirkungen auf die Bildung haben, da sie darauf hindeuten, dass Jugendliche bei Lernaufgaben mehr von positiven als von negativen Rückmeldungen profitieren.
Schlüsselbegriffe
Lernen durch Belohnung, Jugendalter, Entscheidungsfindung, DEVELOP-LEARNING, kontrafaktisches Lernen, Lernen durch Strafe