Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Range-adapting reinforcement learning and memory

Descripción del proyecto

Cómo influyen las experiencias pasadas en la toma de decisiones

Las investigaciones sobre la toma de decisiones perceptivas y económicas sugieren que el valor subjetivo de una opción está determinado por la gama de valores de otras opciones disponibles. Sin embargo, la investigación se ha centrado casi exclusivamente en situaciones de decisión explícitas y estáticas, ignorando los escenarios formados dinámicamente por rangos de valores pasados. El equipo del proyecto RaReMem del Consejo Europeo de Investigación investigará si la adaptación de rangos afecta al cálculo de los valores de los resultados adquiridos a partir de la experiencia y almacenados en la memoria, y de qué manera. En el proyecto se combinarán paradigmas experimentales originales, análisis conductuales y modelos computacionales para ofrecer una descripción algorítmica clara sobre la adaptación del rango de resultados, explicar la naturaleza de las representaciones distorsionadas en la memoria de los valores de los resultados y demostrar la omnipresencia y el valor adaptativo de este proceso.

Objetivo

A wealth of evidence in perceptual and economic decision-making research suggests that the subjective value of one option is determined by the range of the values of other available options (i.e. the context). Yet, up until today, this literature has almost exclusively focused on decision situations where contexts are explicit and static, thus ignoring more ecological and realistic scenarios where value ranges are dynamically shaped by past outcomes.
This proposal will investigate if and how range adaptation also affects the computation of outcome values that are acquired from experience and stored in memory. We hypothesize that range-adaptation is pervasive in learning, because it addresses a fundamental computational cost-benefit trade-off.
Indeed, we propose that, although range adaptation is locally optimal, because it optimizes information processing by tuning the value response function to the experienced outcome distribution, this comes at the price of forfeiting the capacity to generalize learned-values to new contexts.
The proposed research will design and validate a comprehensive behavioural and computational framework to test this hypothesis. More precisely, combining original experimental paradigms, behavioural analyses and computational modelling, we will
i) provide a clear algorithmic description of outcome range adaptation,
ii) elucidate the nature of the distorted memory representations of outcome values, and, finally,
iii) probe the pervasiveness and adaptive value of this process empirically (by running experiments in different cultures) and theoretically (through extensive simulations).
We believe this project has the potential to further elucidate new fundamental computational constraints of human learning and decision-making. Our theoretical framework and empirical results will undoubtedly contribute to the debate about the ultimate sources of human bounded rationality, with potential impact beyond cognitive science.

Institución de acogida

INSTITUT NATIONAL DE LA SANTE ET DE LA RECHERCHE MEDICALE
Aportación neta de la UEn
€ 1 995 826,00
Dirección
RUE DE TOLBIAC 101
75654 Paris
Francia

Ver en el mapa

Región
Ile-de-France Ile-de-France Paris
Tipo de actividad
Research Organisations
Enlaces
Coste total
€ 1 995 826,00

Beneficiarios (1)