Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Inhalt archiviert am 2024-06-18
Developmental trajectories for model-free and model-based reinforcement learning: computational and neural bases

Article Category

Article available in the following languages:

Bessere Entscheidungen durch bestärkendes Lernen

Eine Untersuchung zum Thema der Entwicklung des bestärkenden Lernens im Jugendalter hat weitere Einblicke in die Entscheidungsfindung auf Grundlage der Bestärkung bei Jugendlichen erbracht.

Die Entscheidungsfindung stützt sich auf das Wechselspiel mehrerer Prozesse einschließlich Wertdarstellung, Reaktionsauswahl und Lernen. Im Jugendalter können Entscheidungen oftmals als impulsiv und hochrisikoreich mit schwerwiegenden Folgen charakterisiert werden. Mit Hilfe von bestärkendem Lernen werden diese Prozesse verknüpft. Es befasst sich mit dem Lernen im Sinne der Verbesserung zukünftiger Entscheidungen eines Einzelnen, um das Auftreten von angenehmen Ereignissen (Belohnungen) zu maximieren und das Auftreten von unangenehmen Ereignissen (Strafen) zu minimieren. Den Prozess zu verstehen, welcher der Entscheidungsfindung im Jugendalter zugrundeliegt, ist wichtig, aber die Herausbildung des bestärkenden Lernens im Jugendalter des Menschen ist erst in jüngster Zeit untersucht worden. DEVELOP-LEARNING (Developmental trajectories for model-free and model-based reinforcement learning: Computational and neural bases) war ein von der EU finanziertes Projekt, das sich dem Ziel widmete, hier mit der Durchführung von Verhaltensexperimenten weiterzukommen. Das erste Experiment umfasste die Durchführung einer neuartigen instrumentellen Lernaufgabe mit grundlegendem Lernen durch Belohnung und Bestrafung, sowie Lernen aus kontrafaktischen (fiktiven) Informationen bei Erwachsenen und Jugendlichen. Man stellte fest, dass die Leistungsfähigkeit der Jugendlichen durch kontrafaktische Informationen nicht erweitert wurde, und die Jugendlichen im Vergleich zu den Erwachsenen bevorzugt durch Belohnung im Vergleich zu Strafe lernten, während Erwachsene auf beide Arten gleichermaßen lernten. Den Resultaten zufolge wandten Erwachsene und Jugendliche nicht den gleichen Algorithmus an, um die Lernaufgabe zu lösen. Anders als die Erwachsenen berücksichtigte das Verhalten der Jugendlichen keine kontrafaktischen Informationen. Des Weiteren lernten die Jugendliche, nach Belohnungen zu suchen, anstelle Strafen zu vermeiden. Erwachsene lernten andererseits, beides gleichermaßen zu suchen und zu vermeiden. Ein gesteigertes Verständnis rechnerischer Veränderungen im bestärkenden Lernen während der Jugend kann uns Einblicke in die wertbasierte Entscheidungsfindung bei Jugendlichen verschaffen. Diese Resultate können überdies potenzielle Auswirkungen auf die Bildung haben, da sie darauf hindeuten, dass Jugendliche bei Lernaufgaben mehr von positiven als von negativen Rückmeldungen profitieren.

Schlüsselbegriffe

Lernen durch Belohnung, Jugendalter, Entscheidungsfindung, DEVELOP-LEARNING, kontrafaktisches Lernen, Lernen durch Strafe

Entdecken Sie Artikel in demselben Anwendungsbereich