¿Responde igual el cerebro ante una sonrisa que ante dinero como recompensas?

¿Qué prefieres como recompensa, una sonrisa con una palabra bonita o un dólar? No, ahora sí, en serio, ¿qué prefieres más? No te pasará nada si dices la verdad. No te preocupes, pues tal vez esta pregunta no tenga nada -o mucho- que ver con el estudio a continuación, pero quizás te haya puesto a pensar. La pregunta que sí tiene mucho que ver es cómo responde el cerebro ante recompensas sociales (como una sonrisa con una palabra bonita) y ante recompensas no sociales (como un dólar). ¿Quieres saber cómo o por qué? Pues, precisamente, en 2012, Alice Lin, Ralph Adolphs y Antonio Rangel publicaron un estudio acerca de si las mismas regiones cerebrales computan recompensas sociales y recompensas no sociales. Veamos en qué consistió su estudio y cuáles fueron sus hallazgos.

Introducción
Lin et al. comienzan explicando que el cerebro necesita computar varias señales distintas con el fin de que un organismo pueda aprender a tomar decisiones correctas entre distintas alternativas:
(1) Al momento de la selección, necesita asignar valores a los diferentes estímulos asociados con cada opción (valores del estímulo, VE); estos son después comparados con el fin de escoger la opción con el valor más alto. 
(2) Después de escoger una opción, el cerebro necesita computar el valor de recompensa asociado con las consecuencias generadas por dicha opción; estas señales se conocen como magnitud de la recompensa (R) o utilidad experimentada. 
(3) Finalmente, un tercer componente crítico es la combinación de las dos señales previas en una señal de predicción del error (PE) que se usa para actualizar los valores del estímulo (Schultz et al., 1997).

Objetivo
Las preguntas fundamentales que guiaron la investigación de Lin et al. fueron: ¿implementan computaciones de aprendizaje de recompensas para las recompensas sociales y no sociales las mismas regiones cerebrales? O, ¿podrían ser distintas para las recompensas sociales -análogamente al procesamiento perceptual especializado de los estímulos sociales (Kanwisher & Yovel, 2006)- las áreas que codifican el valor del estímulo (VE), la predicción del error (PE) y la magnitud de la recompensa (R)? Lin et al. trataron de responder estas preguntas a través del uso de tareas idénticas en los mismos sujetos, usando resonancia magnética funcional (RMf).

Método
Veintisiete mujeres diestras (edad promedio = 22,4 años; rango 18-28; cinco fueron excluidas de los análisis) participaron en este estudio. Las participantes realizaron dos versiones estructuralmente idénticas de una tarea de aprendizaje instrumental, una con recompensas monetarias y la otra con recompensas sociales (ver figura 1). En cada ensayo se mostraban dos "maquinitas" [máquinas tragaperras o tragamonedas; por brevedad, las llamaremos "maquinitas"], cada una asociada con una de tres distribuciones de resultados: positiva, negativa y neutral. 

Fig. 1. Tarea y estímulos utilizados en el experimento de Lin et al. (A) Cómo estuvieron estructuradas las tareas en el tiempo (a la izquierda, la tarea social y a la derecha, la monetaria). (B) Distribución de las "maquinitas": primera columna, porcentajes en que cada una conducía a un resultado positivo; segunda, porcentajes en que cada una conducía a un resultado neutral; tercera, porcentajes en que cada una conducía a un resultado negativo. 

En la RMf, todas las participantes completaron un bloque "social" y uno "monetario" de 148 ensayos cada uno. Hubo dos tipos de ensayos en cada bloque: 
(a) 100 ensayos de selección: la máquina neutral era mostrada pareada con una máquina positiva o una negativa y los participantes escogían una al presionar el botón derecho o el izquierdo. Estos son los ensayos "de libre selección". 
(b) 48 ensayos de no selección: se mostraban dos copias idénticas de una de las tres maquinitas y los participantes simplemente presionaban el botón izquierdo o derecho con el fin de pasar al siguiente ensayo. Estos fueron los ensayos "de selección forzada". 

Cada participante tenía 2,5 s para la selección en ambos casos [(a) y (b)], seguido de un pantalla en blanco (1-5 s) y después la recompensa resultante (mostrada por 1,5 s). Las participantes tuvieron que aprender las probabilidades de recompensa asociadas con cada máquina a través de ensayo y error durante la tarea.

Lin et al. incluyeron los ensayos de selección forzada [(b)] con el fin de proporcionar un  control esencial para un factor importante de confusión en el estudio, a saber, que la presentación de consecuencias sociales positivas y aversivas indujera en el cerebro señales de retroalimentación en términos de "correcto" o "error" en la consecuencia obtenida durante los ensayos sociales. Lin et al. explican que estos ensayos fueron un control, pues cuando no hay libre elección, no puede haber retroalimentación de error con respecto a lo correcto de una opción.

En ambas condiciones, las maquinitas fueron representadas por imágenes de caricatura de máquinas tragamonedas reales que variaban en color y patrones (ver figura 1).

En la condición social, las recompensas resultantes fueron fotografías a color de rostros desconocidos que mostraban una expresión emocional enojada (resultado negativo), neutral (resultado neutral) o de alegría (resultado positivo), presentadas junto con palabras relacionadas emocionalmente, a través de audífonos. Ejemplos de palabras positivas fueron "excelente", "bravo" y "fantástico"; ejemplos de palabras negativas fueron "estúpida", "boba" y "equivocado"; ejemplos de palabras neutrales fueron "escritorio", "papel" y "grapadora".

En la condición monetaria, la consecuencia positiva fue la ganancia de un dólar (una imagen de un billete de un dólar), la condición negativa fue la pérdida de un dólar (imagen de un billete de un dólar tachado) y la condición neutral se refirió a ningún cambio en la recompensa monetaria (imagen de un rectángulo vacío). A las participantes se les pagó la suma ganada al final del experimento.

Modelo computacional
El valor del estímulo (VE) para cada maquinita se calculó como la proporción promedio -en 10 ensayos- según las veces en que la máquina fue escogida, un valor continuo entre 0 y 1. A la magnitud de la recompensa (R) se le asignó un valor de 1 si los estímulos eran positivos, un valor de 0,5 si eran neutrales y un valor de 0 si eran negativos. La predicción del error (PE) al momento del resultado fue calculado como la diferencia entre el valor de la recompensa resultante (R) y el valor del estímulo (VE) de la máquina seleccionada para ese ensayo.

Las imágenes cerebrales se tomaron en un escáner de 3 Tesla.

Resultados
Resultados comportamentales
Los participantes aprendieron a seleccionar la maquinita asociada con la probabilidad más alta de una consecuencia con valencia positiva dentro de unos cuantos ensayos para recompensas tanto sociales como no sociales. Adicionalmente, con respecto al proceso de aprendizaje, las participantes fueron algo "más lentas" en aprender a discriminar entre recompensas sociales que entre recompensas monetarias. Las participantes también tardaron más en aprender a evitar las maquinitas negativas que en escoger las positivas. Tal diferencia no fue significativa en el último tercio de los ensayos de aprendizaje, lo cual, según Li et al., sugiere que está relacionada con la rapidez del aprendizaje y no con la habilidad para aprender el valor de los estímulos.

Resultados de RMf
Ver Tabla 1 sobre los correlatos neurales en cada una de las tareas y su conjunción en cada una de las fases de computación cerebral. [Ver imágenes].

Tabla 1. Correlatos neurales.


Tarea monetaria de libre elección
Tarea social de libre elección
Conjunción
Valores del estímulo (VE)
Correlacionó con la activación en la CPFvm. También se encontró señal en el cíngulo medio, el GFS y el giro angular.
La activación también se encontró en una región similar de la CPFvm.
Correlacionó con la activación en un área común de la CPFvm en las condiciones tanto social como monetaria.
Predicción del error (PE)
Correlacionó con la activación en el caudado y el putamen.
No mostró ninguna correlación en el umbral establecido (p < 0,001)
-
Magnitud de la recompensa (R)
Correlacionó con la activación de la CPFvm, la ínsula, la corteza occipital, el giro cingulado y el GFS.
Correlacionó con la activación en la CPFvm.
Correlacionó con la activación en un área común de la CPFvm en ambas condiciones.
Correlatos neurales de cada una de las tareas y su conjunción (columnas) en cada una de las fases de computación cerebral (filas). CPFvm: corteza prefrontal ventromedial; GFS: giro frontal superior.

¿Hay o no un factor de confusión en los resultados?
Un factor potencial de confusión, no trivial, es que los rostros felices y enojados pudieran activar las señales de retroalimentación "correcto" y "equivocado" en el cerebro, con respecto a la adecuación de la selección, y que las áreas de co-activación pudieran ser debidas a la presencia de estas señales de error y no a la computación de recompensas sociales. Sin embargo, los ensayos de selección forzada proporcionaron un control que permitió verificar, efectivamente, que la fuerza de la correlación (entre las señales de recompensa y la actividad BOLD en el área de la CPFvm identificadas por la conjunción de recompensas en ambas condiciones) en los ensayos social y monetario fuera de magnitud similar y no estadísticamente diferente, aun en ausencia de la retroalimentación de error. Según Lin et al., esto implica que la señal en la CPFvm durante consecuencias sociales no puede ser atribuida a retroalimentación de error, y, por ende, que la preocupación acerca del factor potencial de confusión, en esta tarea, era infundado.

Discusión
Según Lin et al., hasta hoy había faltado un estudio que comparara recompensas sociales y no sociales a través de tareas cuya estructura básica y probabilidades de recompensa estuvieran relacionadas para los dos tipos de recompensa y en la cual las tres computaciones básicas asociadas con el aprendizaje de recompensas (VE, R y PE) estuvieran en funcionamiento. Precisamente, eso fue lo que ellos hicieron en este estudio. 

Como se mencionó previamente, Lin et al. encontraron evidencia para señales [de activación] comunes [a recompensas sociales y no sociales] en todos los casos: un área común de la CPFvm correlacionó con el valor del estímulo ["costo" del estímulo], un área común de la CPFvm correlacionó con la magnitud de la recompensa ["positiva", "negativa" o "neutra"] y áreas comunes del estriado ventral correlacionaron con la predicción del error [diferencia de lo "recibido" a partir de lo "esperado"], aunque en el último casi sólo en un umbral relativamente bajo de p < 0.005.

Según Lin et al., sus resultados proporcionan soporte a la idea creciente de que las áreas que se solapan en la CPFvm y el estriado ventral codifican las señales de valor para ambos tipos de recompensa (Montague & Berns, 2002; Rangel, 2008).

Lin et al. enfatizan en que la existencia de áreas similares implicadas en la codificación de la recompensa en las situaciones sociales y no sociales no significa que la red completa implicada en el procesamiento de ambos tipos de recompensa sea idéntica. Por ejemplo, las computaciones de teoría de la mente están probablemente más activas durante las decisiones sociales que durante las opciones entre las recompensas no sociales (Saxe & Kanwisher, 2003; Saxe, 2006; Krach et al., 2010).

Finalmente, los investigadores reconocen dos limitaciones en su estudio: (1) que no pueden descartar la posibilidad de la existencia de posibles sub-poblaciones neuronales dentro de la CPFvm y el estriado ventral especializadas en la valuación de tipos de recompensa específicos y (2) que como hombres y mujeres pueden procesar de manera distinta algunos tipos de recompensa social (Spreckelmeyer et al., 2009), puede haber una diferencia de género en cuanto al uso de ese circuito común que ellos no pudieron conocer, debido a que sólo participaron mujeres.

Lin, A., Adolphs, R., & Rangel, A. (2012). Social and monetary reward learning engage overlapping neural substrates. SCAN, 7. pp. 274-281.


Comentario
Bien, esta fue la presentación del artículo de hoy. Antes de comentarlo, quisiera que nos hiciéramos conscientes de que los resultados de Lin et al. no implican directamente algo como que "procesamos de la misma manera estímulos monetarios que estímulos sociales". No. Lin et al. hacen énfasis en que sus resultados revelan un solapamiento parcial ante esta tarea de aprendizaje instrumental y sólo en cuanto a dichos estímulos como recompensas, no como estímulos en general.

Ahora sí, como vimos, Lin et al. mostraron que la activación cerebral (en los tres estadios de computación básica del aprendizaje de recompensas) ante la recompensa social fue muy similar a cuando la recompensa fue no social. ¿Qué implica este hallazgo? Por ahora, eso mismo. Aunque parezca una tautología, aislado, este hallazgo no nos permite concluir más allá. Además, es mejor ser prudentes en cuanto a interpretaciones (de lo que no somos expertos).

Por otro lado, si quizás alguien se está preguntando qué tan "no social" es el dinero, debo decirle que yo también me lo pregunto. No es tan "asocial". Todo lo contrario, es "demasiado" social. En últimas, lo que sucede es que hemos incluido en nuestro entorno social tantos elementos -de otra manera- neutros, que ya nada parece completamente aparte o puro. Quizás, esta pueda ser una crítica al estudio. De todas formas, tal vez el punto de los autores es algo que directamente involucra a otro ser humano (social) versus algo que no lo involucra directamente (no social). Además, ellos se ciñen sólo a la categoría "monetario". Sin embargo, aún queda la duda, pues tal vez el hallazgo de regiones similares se deba a que ambos estímulos sean sociales [¿Cuál podría ser un estímulo verdaderamente no social que pueda ser usado como recompensa y que pueda equipararse en valor a una sonrisa o a un regaño?]. 

Adicionalmente, hubiera sido interesante comparar la activación cerebral en los primeros ensayos (cuando se está comenzando a "ver" la asociación) con la de los últimos (cuando ya se ha aprendido la asociación entre estímulo y respuesta), ya que al principio pueden codificarse "igual" los estímulos sociales y no sociales, cuando apenas se está estableciendo la asociación, mientras que puede ser distinto cuando ya se tiene claro a qué recompensa lleva cada estímulo. De manera similar, hubiera sido interesante que se hubiera correlacionado la percepción de preferencia de las participantes (con respecto a las recompensas) con la velocidad de aprendizaje o el grado de activación ante cada recompensa.

En definitiva, este es un estudio que valía la pena compartir y que, seguro, resultará especialmente útil para quienes están interesados en el campo de la "neuroeconomía" o en el estudio de la toma de decisiones. Por cierto, ¿y qué respuesta le das al título?

¿Te pareció interesante, útil o inspiradora esta información? Seguro a alguien que conoces, también. ¡No dudes en difundirla!

¿Sugerencias? Contáctanos

Comentarios