¿ Pueden estímulos relacionados con la ausencia de recompensa reducir la impulsividad en ratas?

Sosa, Rodrigo; Valério, Cristiano

Serviços Personalizados

artigo

Tradução automática

Indicadores

Acessos

Mais
Mais

Permalink

Acta Comportamentalia

versão impressa ISSN 0188-8145

Acta comport. vol.22 no.2 Guadalajara 2014

Artículo

¿Pueden estímulos relacionados con la ausencia de recompensa reducir la impulsividad en ratas?¹

Can stimuli related to the absence of reward reduce impulsivity in rats?

Rodrigo Sosa^I, Cristiano Valério^I

^IUniversidad de Guadalajara-CEIC (México)

RESUMEN

En el presente trabajo se exploró la posibilidad de que un estímulo relacionado con la ausencia de una recompensa primaria adquiriera una función aversiva en una situación de elección. Se expuso a ratas a una condición de elección entre dos alternativas: (1) la entrega de agua después de transcurrido un intervalo de demora, y (2) la presentación de un ruido blanco seguido de un tiempo fuera. De este modo, el ruido blanco fue un predictor negativo de la entrega de agua. La aversividad adquirida por el ruido blanco fue evaluada examinando la preferencia de los sujetos por una alternativa SS (i.e., entrega de agua inmediata con una menor magnitud) en la que se añadía el ruido blanco. En el Experimento 1 se utilizó un diseño mixto; es decir, se comparó la ejecución de los sujetos después del tratamiento experimental con su ejecución previa al tratamiento, y también se comparó su ejecución con sujetos en grupos de control. Los sujetos del Grupo Experimental mostraron una menor preferencia por la alternativa SS después de la Fase de Tratamiento comparada con su propia ejecución durante la Línea Base y comparada con la ejecución de los sujetos de control. Sin embargo, dichas diferencias no fueron estadísticamente significativas. En el Experimento 2 se incrementó el tamaño de la muestra y se utilizó un diseño entre grupos. Nuevamente, los sujetos del Grupo Experimental mostraron una menor preferencia por la alternativa SS que los sujetos de control. Sin embargo, este efecto podría ser interpretado mediante una explicación distinta a que el ruido blanco haya adquirido propiedades aversivas.

Palabras clave: impulsividad, autocontrol, elección, aversividad, relación negativa, recompensa secundaria, reforzamiento condicionado.

ABSTRACT

The present work explored the possibility that a stimulus paired with the absence of a primary reward acquire an aversive function in a choice situation. Rats were exposed to a choice condition between two alternatives: (1) water delivery after a delay interval elapsed, and (2) presentation of a white noise followed by a time out. Thereby, the white noise was a negative predictor of water delivery. Aversivity acquired by the white noise was evaluated by looking at subject's preference for a SS alternative (i.e., immediate delivery of a small amount of water) in which the white noise was added. In Experiment 1 it was implemented a mixed design; namely, performances before and after experimental treatment were compared, and also it were compared performance of experimental subjects and that of subjects in control groups. Subjects of the Experimental Group showed a lower preference for SS alternative compared to their own performance prior to the Training Phase and compared to control subjects, but such differences did not achieve statistical significance. In Experiment 2 it was increased the sample size and implemented a between groups design. Once again, Subjects of the Experimental Group showed a smaller preference for SS alternative compared with control subjects. However, such differences could be interpreted by an explanation distinct to the one that propose that the white noise acquired aversive properties.

Key words: impulsivity, self-control, aversiveness, negative relation, secondary reward, conditioned reinforcement.

El concepto de impulsividad debe tomarse en cuenta en conjunto con su contraparte, el autocontrol. Ambos conceptos (i.e., impulsividad y autocontrol) representan tendencias conductuales opuestas dentro de una dimensión continua; de ninguna manera se les considera como clasificaciones dicotómicas. Desde la perspectiva conductual, una de las definiciones más difundidas de impulsividad es la tendencia a elegir recompensas pequeñas e inmediatas sobre recompensas demoradas y de mayor magnitud, mientras que el autocontrol se define como la preferencia de recompensas demoradas de mayor magnitud a expensas de recompensas inmediatas más pequeñas (Ainslie, 1974). Dicha conceptualización tiene la ventaja de utilizar definiciones operacionales, lo que facilita el estudio empírico del fenómeno (Logue, 1988).

La dimensión impulsividad/autocontrol suele ser estudiada mediante procedimientos denominados de elección intertemporal, cuya característica principal es presentar al individuo dos alternativas que difieren en cuanto a magnitud y demora de la recompensa, siendo normalmente la alternativa de mayor demora la que ofrece una recompensa de mayor magnitud. Dicha alternativa se conoce como alternativa LL, por sus siglas en inglés (larger later), mientras que la alternativa remanente se conoce como SS (smaller sooner). Los individuos que muestren una mayor preferencia por la alternativa SS serán considerados más impulsivos, mientras que los que prefieren la alternativa LL en mayor medida serán considerados como más autocontrolados.

Diversos autores han discutido sobre los factores que influyen en la preferencia de los individuos en los procedimientos de elección intertemporal. Algunos de ellos han propuesto que una variable crítica implicada en el comportamiento de los individuos que muestran autocontrol es la influencia ejercida por los estímulos relacionados con la demora en la alternativa LL. Por ejemplo, Ainslie (1975) sugirió que si el organismo es capaz de detectar las señales que predicen la entrega de la recompensa en la alternativa LL, estas señales podrían convertirse en recompensas secundarias, por la relativa contigüidad temporal que guardan con la recompensa primaria que se entrega al final de que transcurre el intervalo de demora. Mazur (1995) incluso propuso un modelo matemático que busca determinar el valor de dichas recompensas secundarias en función de la duración de la demora.

Otro autor que ha dedicado un esfuerzo considerable a defender la idea de que las recompensas secundarias son cruciales en el comportamiento autocontrolado es Eisenberger (1992). Este autor y sus colaboradores han aportado numerosas evidencias de que el exponer a un individuo a una situación que exige cierto grado de autocontrol promueve que dicho individuo se comporte de manera más autocontrolada en situaciones posteriores (e.g., Eisenberger & Adornetto, 1986; Eisenberger & Masterson, 1986; Eisenberger, Weier, Masterson, & Theis, 1989). Eisenberg asevera que cuando una recompensa es antecedida por esfuerzo físico, cognitivo o el tolerar algún evento aversivo (como un choque eléctrico o la misma demora de la recompensa) se dota de un valor reforzante a la sensación de esfuerzo, reduciendo de este modo su inherente aversividad. Este valor como recompensa secundaria, según el autor, se generaliza a través de diferentes tipos de conducta.

Complementando la idea de que recompensas secundarias (i.e., estímulos que a través del condicionamiento han adquirido la capacidad para incrementar una respuesta que los produzca) relacionadas con la alternativa LL son cruciales para el desarrollo de comportamiento autocontrolado, se podría proponer que también los estímulos relacionados con la alternativa SS juegan algún papel. En tal caso, para que se desarrolle comportamiento autocontrolado sería necesario que los estímulos relacionados con la alternativa SS adquirieran una función aversiva, de tal manera que se eligiera menos dicha alternativa y, por lo tanto, favoreciendo la preferencia por la alternativa LL. Se puede definir como estímulo aversivo a todo evento que al ser producido por una respuesta disminuye la probabilidad de que dicha respuesta se presente en el futuro o que, al ser prevenido o eliminado por una respuesta, aumenta la probabilidad de dicha respuesta (Leitenberg, 1968).

Un estímulo neutro puede adquirir propiedades aversivas si este se relaciona negativamente con una recompensa primaria. Esta idea ha sido desarrollada teóricamente (Daly & Daly, 1982; Wagner, 1969) y apoyada empíricamente (Wasserman, Franklin, & Hearst, 1974). El objetivo del presente trabajo fue explorar la posibilidad de que, al establecer una relación negativa entre un estímulo asociado con la alternativa SS y la entrega de la recompensa, dicho estímulo adquiera una función aversiva que se refleje en la preferencia por dicha alternativa. La función de este supuesto estímulo aversivo condicionado se evaluó observando la preferencia en un programa de elección intertemporal en el que este estímulo se presentó contingente a la elección de la alternativa SS. Si dicho estímulo, en efecto, adquirió propiedades aversivas, entonces los individuos sometidos al tratamiento elegirían menos la alternativa SS cuando dicha alternativa fuera acompañada por el supuesto estímulo aversivo. Esta predicción tiene sentido bajo el supuesto de que la conducta de elección es determinada por una contribución conjunta de las consecuencias "positivas y negativas" (apetitivas y aversivas) asociadas con cada alternativa (Eisenberger, et at., 1989).

EXPERIMENTO 1

Método

Sujetos. Dieciocho ratas (Rattus norvegicus) hembra de la cepa Wistar Lewis de aproximadamente tres meses de edad. Las ratas se encontraban en un peso de entre 180 y 230 g y tuvieron acceso libre a alimento en sus cajas habitación. Los animales fueron sometidos a un régimen de privación de agua con 20 minutos de acceso diarios, además de lo que consumieran en la sesión experimental.

Aparatos. Cuatro cámaras de condicionamiento para ratas de la marca MED (ENV-008), con las siguientes dimensiones: 30 cm de largo x 25 cm de ancho x 21 cm de alto. En la pared frontal de la caja se localizaba una puerta de acceso de poliuretano transparente; la pared posterior estaba compuesta del mismo material. El panel derecho de la cámara estaba conformado por tres vías de acero inoxidable en las que se insertaron los componentes utilizados en el estudio. Cada caja estuvo equipada con un dispensador de agua (ENV-202M) insertado en la vía central del panel derecho, y dos palancas retráctiles en cada una de las vías adyacentes. Las palancas se encontraba a 2.5 cm del piso de rejilla y se requirió de una fuerza de aproximadamente 0.14 N para cerrar el microswitch. El dispensador de agua consistía en una cuchara que se sumergía en una pileta tomando 0.01 ml de agua cada vez que se activaba dicho mecanismo. El líquido se hacía disponible para el animal a través de una ranura cuadrangular situada en el panel derecho de la cámara; la dimensión de dicha ranura era de 5 X 5 cm. Como estímulo arbitrario se utilizó un ruido blanco de 60 dB producido por una bocina ubicada en la parte superior de la vía distal del panel derecho. Cada cámara experimental se colocó dentro de un cubículo de aislamiento acústico (ENV-022M). La programación de eventos, el registro de respuestas y la recolección de datos se realizaron mediante un equipo de cómputo, una interfaz y el software MED-PC IV para ambiente Windows.

Procedimiento. Se utilizó un diseño mixto, entre grupos e intrasujetos. Después de pasar por una fase de moldeamiento de la respuesta de presión en ambas palancas, todos los sujetos fueron expuestos a una condición de Línea Base, en la que se registró la variable de interés (i.e., preferencia) previo al tratamiento experimental. Cuando los sujetos cumplían con un criterio de estabilidad eran asignados a uno de tres grupos: Grupo Experimental, Grupo Control TTT o Grupo Control DEL. Conforme fueron cumpliendo con el criterio de estabilidad los sujetos eran asignados a triadas. Todas las triadas estuvieron compuestas por un sujeto de cada grupo. Los sujetos de cada triada en particular estuvieron expuestos exactamente al mismo número de sesiones en cada fase. Después de la Línea Base, los sujetos de cada triada fueron expuestos a un tratamiento distinto, cada uno de los cuales se describirá más adelante. La asignación de sujetos a grupos se realizó procurando que la ejecución promedio en la Línea Base por cada grupo fuera lo más aproximada posible. El número de sesiones de exposición a la Fase de Tratamiento fue determinado por el número de sesiones necesarias para que el elemento del Grupo Experimental en cada triada cumpliera con el criterio de estabilidad; una vez que pasó esto, todos los sujetos de la triada pasaban a la Fase de Prueba en la que, nuevamente se les expuso a las condiciones de la Línea Base. Para cada triada, el experimento concluyó una vez que sus tres elementos cumplieran con el criterio de estabilidad en la Fase de Prueba. En la Tabla 1 se muestra un resumen del diseño experimental. Posteriormente se realiza una descripción detallada de cada condición, así como de las medidas utilizadas y el análisis de los datos que se efectuó. Cabe destacar que, a diferencia de la mayoría los procedimientos de elección, no se utilizaron ensayos forzados. Esto se debe a que se alternó sesión con sesión la lateralidad de las alternativas, y eso se consideró suficiente para que los sujetos experimentaran las consecuencias de ambas alternativas regularmente.

Línea Base. Durante esta fase, se expuso a los sujetos a una situación de elección entre dos alternativas; una de ellas entregaba 0.01 ml de agua en seguida (alternativa SS) y la otra alternativa entregaba 0.03 ml de agua con 15 segundos de demora (alternativa LL). Al inicio de cada ensayo, se proyectaban ambas palancas, cada una de las cuáles estaba relacionada con una alternativa. La primera presión de cualquiera de las palancas (respuesta inicial) activaba un programa de Intervalo Aleatorio de 20 segundos. Como consecuencia, en cada ensayo, una vez dada la respuesta inicial, transcurrían en promedio 20 segundos para que una respuesta fuera operativa. El intervalo aleatorio constaba de segmentos temporales de un segundo con una probabilidad de 0.05 de que la primera respuesta fuera operativa al terminar un segmento en particular. Las respuestas durante dicho intervalo fueron registradas, pero no tuvieron consecuencias programadas. Después de transcurrido el intervalo, la primera presión en la palanca relacionada con la alternativa SS provocaba que inmediatamente se retrajeran ambas palancas, se iniciara un ruido blanco y se entregara 0.01 ml de agua. El ruido blanco tenía una duración de un segundo, mientras que la cuchara que hacía disponible el agua se retiraba después de 3 segundos. Después de que fuera retirado el brazo del dispensador de agua, transcurría un periodo con una duración de 21 segundos sin eventos programados (tiempo fuera). Cuando se cumplía dicho periodo se volvía a hacer disponibles las palancas y comenzaba un nuevo ensayo. Por su parte, la primera presión de la palanca relacionada con la alternativa LL al haber transcurrido el intervalo aleatorio propiciaba que ambas palancas se retrajeran y transcurriera un periodo de demora con una duración de 15 segundos. Cuando se cumplía el periodo de demora, se producía el ruido blanco por un segundo y se entregaba 0.01 ml de agua tres veces; cada entrega duraba tres segundos. Después de la última entrega de agua, se proyectaban las palancas e iniciaba un nuevo ensayo. Sumando el intervalo aleatorio, las entregas de agua y la demora o tiempo fuera, los ensayos en que se eligiera la alternativa LL o SS tenían la misma duración, en promedio 44 segundos, siempre y cuando no se tomen en cuenta las latencias de la respuesta inicial y de la respuesta procuradora. Las sesiones terminaban cuando se cumplieran 60 ensayos o transcurrieran 60 minutos; lo que sucediera primero.

Tratamiento

Grupo Experimental. Para los sujetos del Grupo Experimental, las condiciones durante la Fase de Tratamiento fueron semejantes a las de la Línea Base. La única diferencia es que las respuestas procuradoras en la alternativa SS no tenían como consecuencia la entrega de agua. En dicha condición, la elección de la alternativa SS conllevaba a la retracción de ambas palancas y la presentación del ruido blanco por un segundo. Al terminar el ruido blanco, entraba en vigor un tiempo fuera con una duración de 23 segundos (se agregaron 8 s para compensar la ausencia de entrega de agua). La elección de la alternativa LL en esta situación conllevaba a la misma cadena de eventos que se describió para la Línea Base. Nótese que el mismo ruido blanco temporalmente relacionado con la entrega de 0.03 ml de agua en la alternativa LL era producido inmediatamente ante la elección de la alternativa SS². Nótese también que cada elección de la alternativa SS tenía como consecuencia un tiempo fuera (lapso en el que la recompensa no estaba disponible) que excedía los 23 segundos, ya que para poder tener acceso a la recompensa (que únicamente estaba disponible en la alternativa LL) tenían que transcurrir, por lo menos, 20 segundos (en promedio) del intervalo aleatorio del siguiente ensayo, mas 15 segundos de la demora (un total de 53 segundos, en promedio). Esto, asumiendo que en el siguiente ensayo se eligiera la alternativa LL y sin tomar en cuenta las latencias de la respuesta inicial y de la respuesta procuradora. Por lo tanto, puede afirmarse que el ruido blanco en la alternativa SS era un predictor negativo de la entrega de agua o un predictor de la ausencia de agua. En la Figura 1 se muestra un diagrama de la sucesión de eventos en la Fase de Tratamiento para el Grupo Experimental.

Grupo Control TTT. Durante la Fase de Tratamiento los sujetos del Grupo TTT (test-test-test) fueron expuestos exactamente a las mismas condiciones que en la Línea Base. Este grupo se implementó para descartar que los cambios en la ejecución en los sujetos del Grupo Experimental se debieran a la mera exposición a un programa de elección intertemporal por un largo periodo de tiempo, como fue reportado por Fantino (1966).

Grupo Control DEL. Los sujetos del Grupo Control DEL (demora) durante la Fase de Tratamiento fueron expuestos a una condición en la que la elección de cualquiera de ambas palancas desencadenaba la sucesión de eventos relacionada en la Línea Base con la alternativa LL. Es decir, ambas alternativas dispensaban 0.03 ml de agua después de 15 segundos de demora. Este grupo se implementó con la finalidad de descartar que cualquier cambio en la ejecución por parte de los sujetos del Grupo Experimental se debiera al simple hecho de que fueron expuestos a una condición en la que la única manera de acceder a la recompensa fuera de manera demorada o a una condición en que sólo se produjeran recompensas de mayor magnitud. Esto se basa en la idea de que la exposición a los intervalos de demora pudiera "habituar" a los sujetos a la aversividad de la demora, haciendo menos aversiva a la alternativa LL (Eisenberger & Adornetto, 1986); o, por otro lado, en la idea de que debido a la exposición a la recompensa de mayor magnitud, los sujetos muestren un efecto de contraste negativo (Hulse, 1973), prefiriendo menos la alternativa de menor magnitud (i.e., SS).

Prueba

Durante esta fase fueron restituidas las condiciones de la Línea Base para todos los sujetos.

Medidas Utilizadas

Se utilizaron principalmente dos medidas. Por su relativamente poca variabilidad, para la ponderación del índice de estabilidad, así como para la asignación de sujetos a grupos, se utilizó una medida de proporción de respuestas en la alternativa LL. En cambio, al ser una medida más sensible, para comparar las ejecuciones entre grupos y pre y post tratamiento intrasujetos y entre grupos se utilizó una medida de razón a prueba de sesgo (Peters, Hunt, & Harper, 2004).

Los datos de cada sesión se dividieron en bloques de diez ensayos y se fueron excluidos del análisis los primeros dos bloques debido a un posible acarreo de la ejecución exhibida durante la sesión anterior. Para reducir la variabilidad entre sesiones, debido a que una gran parte de los sujetos mostró una fuerte preferencia de lado, se usó una media móvil con una ventana temporal de dos sesiones, calculando el promedio de cada sesión y la sesión previa (en adelante se referirá a este valor como puntos). Así, el primer punto a analizar fue el promedio de la primera y la segunda sesión, el segundo punto a analizar fue el promedio de la segunda y tercera sesión, y así sucesivamente. La medida de razón se calculó mediante los siguientes pasos: multiplicar la razón (respuestas en LL sobre respuestas en SS) de dos sesiones sucesivas, obtener logaritmo natural y dividir el resultado entre 2 (Peters, et al., 2004).

El índice de estabilidad, que sirvió como criterio para cambiar de fases, se calculó comparando la variabilidad en diez puntos sucesivos, relativa a la pendiente calculada para dicha serie de puntos (Tryon, 1982).

RESULTADOS Y DISCUSIÓN

La Figura 2 muestra la preferencia de los sujetos de todos los grupos (Log LL/SS) durante todas las sesiones de la Fase de Prueba. El número de sesiones (eje horizontal) varía de acuerdo con el número de sesiones que necesitaron los tres elementos de cada triada en particular para satisfacer el criterio de estabilidad. La línea discontinua representa el promedio de la preferencia durante las diez últimas sesiones de la Línea Base para cada sujeto. En la columna izquierda se puede observar que cuatro de los sujetos del Grupo Experimental (F4, F3, F16 y F1) incrementaron sustancialmente su preferencia por la alternativa LL durante la Fase de Prueba, con respecto a la Línea Base. Los dos sujetos restantes no muestran una diferencia clara en su preferencia por LL antes y después del tratamiento.

En la columna central de la Figura 2 se muestra la misma medida para los sujetos del Grupo TTT. A pesar de que en cuatro de los sujetos se puede observar un aumento en la preferencia por la alternativa LL (F14, F13, F2 y F5), solamente uno de los sujetos (F2) muestra un aumento sustancial en dicha medida. Por otro lado, en este grupo se puede observar el caso de un sujeto (F21) que muestra una disminución en su preferencia por la alternativa LL en la Fase de Prueba con respecto a la Línea Base. La columna derecha de la Figura 2 muestra la misma medida para los sujetos del Grupo DEL. En este caso, también se puede observar un pequeño incremento en la preferencia para tres de los sujetos (F9, F10 y F7), mientras que uno de los sujetos muestra un incremento mayor (F6) y otro sujeto muestra un cambio negativo (F11).

La Figura 3 muestra un resumen de los datos desplegados en la figura anterior; se presentan los promedios grupales de la preferencia durante la Línea Base y la Fase de Prueba. Cabe destacar que existe mucha variabilidad interindividual, lo cual ensombrece tanto las diferencias intrasujetos como entre grupos. Puede observarse que durante la Línea Base en los tres grupos la preferencia estaba por debajo del nivel de indiferencia (cero) y es semejante para los tres grupos. La preferencia en la Fase de Prueba aumentó para los sujetos de todos los grupos. Sin embargo, se puede observar que dicha medida tuvo un incremento considerablemente mayor para los sujetos del Grupo Experimental. Se realizó un ANOVA de medidas repetidas a la medida de preferencia y no se encontró diferencias estadísticamente significativas.

Los sujetos del Grupo Experimental mostraron una mayor preferencia por la alternativa LL después de haber pasado por la Fase de Entrenamiento, lo cual apoyaría la hipótesis de que el ruido blanco adquirió una función aversiva. Comparados con los sujetos de los grupos de control, más sujetos del Grupo Experimental mostraron diferencias sustanciales entre la ejecución mostrada durante la Línea Base y la Fase de Prueba (ver, Figura 2). No obstante, los sujetos de ambos grupos de control (sobre todo los del Grupo DEL) también mostraron un aumento en la preferencia por la alternativa LL, con respecto a su ejecución durante la Línea Base; aunque para estos grupos el aumento fue menor. De cualquier modo, la variabilidad entre sujetos no permite llegar a una conclusión firme. El Experimento 2 tuvo como propósito minimizar las variables que posiblemente ensombrecieron las diferencias entre grupos en el Experimento 1.

EXPERIMENTO 2

Uno de los problemas encontrados en el experimento anterior es que la preferencia por la alternativa LL incrementa en los grupos de control. En otras palabras, la variable dependiente (preferencia por LL) cambia independientemente de la manipulación experimental (contingencia negativa estímulo-recompensa). Probablemente, este cambio se deba a la exposición al programa de elección, como plantea Fantino (1966). Por lo tanto, en el Experimento 2 se intentó minimizar, aún más, la exposición al programa de elección. Para ello, se recortó la Línea Base del diseño experimental, quedando así un diseño entre grupos. De igual modo, con la finalidad de disminuir el número de sesiones de exposición al programa de elección, se cambió el criterio para cambiar de fase, estableciendo un criterio de estabilidad menos riguroso. En el Experimento 2, se requirió que la ejecución de los sujetos del grupo experimental alcanzara un valor máximo durante la Fase de Tratamiento para que todos los sujetos pasaran a la Fase de Prueba. Adicionalmente, se aumentó el valor de la demora en la alternativa LL, con la finalidad de mantener en valores bajos la preferencia por dicha alternativa en los sujetos de los grupos de control. Dado que las demoras largas propician que disminuya la tasa de respuesta, se aumentó el nivel de privación de agua para contrarrestar el potencial efecto de incrementar la demora. De este modo, el Experimento 2 consistió de un tratamiento experimental muy similar al experimento anterior, pero con modificaciones en el diseño experimental y algunos parámetros, ideadas con el objetivo de hacer más nítidas las diferencias entre grupos (en caso de haberlas). Asimismo, se aumentó el tamaño de la muestra, de seis a ocho sujetos por grupo.

Método

Sujetos. Veinticuatro ratas albinas (Rattus norvegicus) hembra de la cepa Wistar Lewis de aproximadamente tres meses de edad al inicio del experimento y de entre 170 g y 240 g de peso. Los animales tuvieron acceso libre a alimento en sus cajas habitación y se sometieron a un régimen de privación de agua con 15 minutos de acceso diarios, además de lo que consumieran en la sesión experimental.

Aparatos. Se utilizaron los mismos aparatos descritos anteriormente.

Procedimiento. Se utilizó un diseño entre grupos. Al inicio del experimento, se asignaron ocho sujetos a cada grupo. Dado que se contó con el registro de la camada de la que provenía cada individuo, se optó por distribuir de manera balanceada la cantidad de sujetos de cada camada en los grupos, en lugar de asignarlos aleatoriamente. El número de sesiones de exposición a la Fase de Tratamiento fue determinado por la ejecución de los sujetos del Grupo Experimental. Dado que los sujetos del Grupo Experimental se encontraban en condiciones en las que no se entregaba agua en la alternativa SS, estos sujetos respondían cada vez más (proporcionalmente) en la alternativa LL; cuando todos los sujetos de este grupo llegaban a un punto máximo, todos los sujetos del experimento (incluyendo a los de los grupos de control) fueron cambiados a la Fase de Prueba. De manera similar, la Fase de Prueba se dio por concluida una vez que todos los sujetos del Grupo Experimental alcanzaran un punto mínimo en el valor de la preferencia por la alternativa LL. Al igual que en el experimento anterior, se realizó una alternación de lado en las alternativas cada sesión, por lo cual tampoco se consideró necesario implementar ensayos forzados. En la Tabla 2 se muestra un resumen del diseño experimental. Posteriormente se realiza una descripción detallada de cada condición, así como de las medidas utilizadas y el análisis de los datos.

Grupo Experimental. Para los sujetos del Grupo Experimental las condiciones durante la Fase de Tratamiento fueron casi idénticas a las condiciones por las que pasaron los sujetos del Grupo Experimental en el Experimento 1. Los sujetos podían elegir entre un ruido blanco inmediato seguido por un tiempo fuera (alternativa SS), y un ruido blanco demorado seguido por la entrega de 0.03 ml de agua (alternativa LL); ambas alternativas estaban dispuestas después de un programa de intervalo aleatorio 10 s. A diferencia del experimento anterior, la alternativa LL tenía una demora de 20 segundos. Por consiguiente, también se sumaron cinco segundos al tiempo fuera que sucedía al ruido blanco en la alternativa SS, quedando en 28 segundos. De este modo, el intervalo entre ensayos era aproximadamente el mismo independientemente de la elección de los sujetos. Cada sesión terminaba cuando los sujetos completaran 60 ensayos o se cumplieran 60 minutos; lo primero que ocurriera. Los sujetos se mantuvieron en esta fase hasta que ninguno incrementara su preferencia por la alternativa LL.

Grupo Control TT. Durante esta fase se expuso a los sujetos a una situación de elección entre dos alternativas; una de ellas entregaba de 0.01 ml de agua (alternativa SS) y la otra alternativa entregaba .03 ml de agua con 20 segundos de demora (alternativa LL). La primera presión de cualquiera de las palancas (respuesta inicial) activaba un programa de Intervalo Aleatorio de 10 segundos. Después de transcurrido el intervalo, la primera presión en la palanca relacionada con la alternativa SS provocaba que inmediatamente se retrajeran ambas palancas, se iniciara un ruido blanco y se entregara 0.01 ml de agua. El ruido blanco tenía una duración de un segundo, mientras que la cuchara que hacía disponible el agua se retiraba después de 3 segundos. Después de que fuera retirado el brazo del dispensador de agua, transcurría un periodo con una duración de 26 segundos sin eventos programados (tiempo fuera). Cuando se cumplía dicho periodo se volvían a hacer disponibles las palancas y comenzaba un nuevo ensayo. Por su parte, la primera presión de la palanca relacionada con la alternativa LL, al haber transcurrido el intervalo aleatorio, propiciaba que ambas palancas se retrajeran y transcurriera un periodo de demora con una duración de 20 segundos. Cuando se cumplía el periodo de demora la operación 'entrega de 0.01 ml de agua' se repetía tres veces. Después de la última entrega de agua, se proyectaban las palancas e iniciaba un nuevo ensayo. Sumando el intervalo aleatorio, las entregas de agua y la demora o tiempo fuera, los ensayos en que se eligiera la alternativa LL o SS tenían la misma duración, en promedio 49 segundos. Las sesiones terminaban cuando se cumplieran 60 ensayos o transcurrieran 60 minutos, lo que sucediera primero.

Grupo Control DEL. Los sujetos del Grupo DEL durante la Fase de Tratamiento fueron expuestos a una condición en la que la elección de cualquiera de ambas palancas desencadenaba la serie de eventos relacionados en los otros grupos con la alternativa LL. Es decir, ambas alternativas otorgaban 0.03 ml de agua después de 20 segundos de demora. Este grupo se implementó con la finalidad de descartar que cualquier cambio en la ejecución por parte de los sujetos del Grupo Experimental se debiera al simple hecho de que fueron expuestos a una condición en la que la única manera de acceder a la recompensa era de manera demorada.

Prueba. Durante esta fase se expuso a todos los sujetos a las condiciones a las que se expuso a los sujetos del Grupo TT durante la Fase de Tratamiento.

Medidas Utilizadas. Como indicador de preferencia se utilizó una medida de razón que se calculó mediante los siguientes pasos: multiplicar la razón (respuestas en LL sobre respuestas en SS) de dos sesiones sucesivas, obtener el logaritmo natural y dividir el resultado entre 2 (Peters, et al., 2004).

Los datos de cada sesión se dividieron en bloques de diez ensayos y se excluyó del análisis a los primeros dos bloques debido a un posible acarreo de la ejecución exhibida durante la sesión anterior. Para reducir la variabilidad entre sesiones, debida a que una gran parte de los sujetos mostraban una fuerte preferencia de lado, se analizó el promedio de cada sesión y la sesión previa (en adelante se referirá a este valor como puntos). Así, el primer punto a analizar fue el promedio de la primera y la segunda sesión, el segundo punto a analizar fue el promedio de la segunda y tercera sesión y así sucesivamente.

RESULTADOS Y DISCUSIÓN

La Figura 4 muestra los promedios grupales de preferencia por la alternativa LL (ln LL/SS) en todos los grupos durante la Fase de Prueba. Puede observarse que los sujetos del Grupo Experimental muestran una mayor preferencia por esta alternativa en las primeras sesiones de la Fase de Prueba y que la diferencia estos sujetos y los del resto de los grupos se desvanece conforme avanzan las sesiones de la Fase de Prueba. Se realizó un ANOVA a la medida de preferencia en la primera sesión de la Fase de Prueba para los tres grupos y éste reveló un efecto entre grupos [F(2, 21)=7.11, P=0.004]. Sin embargo, un análisis de comparaciones múltiples post hoc Bonferroni establece que sólo existen diferencias significativas entre el Grupo Experimental y el Grupo TT.

Haciendo un análisis ulterior, se encontró que algunos sujetos tendían a responder en una sola palanca, a pesar de que la lateralidad de las alternativas se cambiaba cada sesión. En casos extremos esto podría inflar la preferencia por la alternativa LL, para los sujetos con una baja tendencia a elegir dicha alternativa. También se encontró que los sujetos del Grupo Experimental presentaron en mayor grado esta tendencia que los sujetos del resto de los grupos. Esto podría propiciar que lo que podría interpretarse como una mayor preferencia por la alternativa LL, en realidad, se trate de un fuerte sesgo por una palanca en particular. La Figura 5 muestra una medida de sesgo calculada como el valor absoluto de la diferencia de la proporción de respuestas en la alternativa LL cuando se encuentra en la derecha y cuando se encuentra en la izquierda. Este valor es graficado para los tres grupos en todas las sesiones de la Fase de Prueba. Se puede advertir una tendencia muy similar a la mostrada en la Figura 4, donde los valores más altos son exhibidos por el Grupo Experimental y la diferencia entre los grupos disminuye conforme transcurren las sesiones. Por lo tanto, las diferencias entre grupos podrían ser propiciadas por una preferencia de lado, en lugar de la preferencia por alguna de las alternativas.

El hecho de que los sujetos del Grupo Experimental hayan mostrado una preferencia por LL estadísticamente mayor que los sujetos del Grupo TT en la Fase de Prueba, apoya la hipótesis de que el tratamiento experimental promueve una mayor preferencia por la alternativa LL. Adicionalmente, el hecho de no haber encontrado diferencias significativas entre el Grupo DEL y el Grupo TT sugiere que las diferencias entre el Grupo Experimental y el Grupo TT no se deben exclusivamente a que los sujetos del Grupo Experimental fueron expuestos a condiciones de reforzamiento demorado. Sin embargo, el análisis del índice de sesgo pone en duda la validez de dicha interpretación de los resultados.

La persistencia en el responder en una sola palanca por parte de los sujetos del Grupo Experimental podría ser explicada por la teoría del momentum conductual (Nevin, 1992), que establece que los individuos que han tenido cierta experiencia persisten más en situaciones operantes. Posiblemente el Tratamiento Experimental produjo que los sujetos del Grupo Experimental mostraran un mayor grado de persistencia y su ejecución no necesariamente refleja una mayor preferencia por la alternativa LL. Por otro lado, la ejecución de los sujetos que persisten en responder en una sola palanca también podría ser interpretada como mayor "tolerancia a la demora", ya que los individuos que responden en una sola palanca enfrentan necesariamente condiciones de reforzamiento demorado en un 50% de las sesiones. La tolerancia a la demora de la recompensa podría ser considerada como una característica del comportamiento autocontrolado.

DISCUSIÓN GENERAL

En el presente trabajo se exploró la posibilidad de que estímulos relacionados negativamente con una recompensa primaria adquieran una función aversiva y que dicha propiedad se reflejara en la conducta de elección. Particularmente, esta hipótesis predecía que al agregar este estímulo a la alternativa SS en una situación de elección intertemporal se reduciría la preferencia por dicha alternativa (i.e., se reduciría la impulsividad).

En el Experimento 1 se observaron diferencias intrasujetos y entre grupos en favor de la hipótesis planteada. Es decir, los sujetos experimentales mostraron menor impulsividad (i.e., preferencia por SS) después del tratamiento en comparación a su ejecución previa al tratamiento, y también mostraron menor impulsividad que los sujetos de los grupos de control. No obstante, aunque las diferencias entre grupos parecen evidentes mediante la inspección visual de los resultados (tanto individuales, como grupales) dichas diferencias no alcanzan significancia estadística, posiblemente debido a que se utilizaron grupos con pocos sujetos y porque estos sujetos desplegaron una considerable variabilidad en su ejecución. Adicionalmente, se observó que los sujetos del Grupo Control TTT también disminuyeron su preferencia por la alternativa SS, sin que fueran expuestos a ningún tratamiento especial, lo cual pone en duda la eficacia del Tratamiento Experimental utilizado.

En el Experimento 2 se buscó minimizar el tiempo de exposición a los programas de elección, intentando evitar así que la preferencia por la alternativa LL aumentara en los sujetos de los grupos de control. Esto se puso en marcha removiendo el registro de la preferencia en la Línea Base. En otras palabras, se prescindió del análisis intrasujetos, quedando un simple diseño entre grupos. Esta vez se encontraron diferencias entre grupos. Sin embargo, dichas diferencias pueden ser interpretadas mediante una explicación distinta a la hipótesis planteada. Es posible que las diferencias entre grupos en el Experimento 2 se deban a un sesgo de lado y no a que realmente el entrenamiento haya sido efectivo para tornar al ruido blanco en un estímulo aversivo.

Al hacer un balance de ambos experimentos, se puede concluir que la evidencia que apoya la hipótesis planteada es débil. En ambos experimentos se encontró evidencia que podría apoyar dicha hipótesis, pero en el Experimento 1 no se alcanza significancia estadística, mientras que en el Experimento 2 no es posible descartar, al menos, una hipótesis alternativa. Existen algunos estudios (e.g., Dixon & Holton, 2009; Zlomke & Dixon, 2006) en los que se ha evaluado la posibilidad de que manipular la función de los estímulos relacionados con las alternativas pueda influir en la preferencia en una situación de elección intertemporal; sin embargo, dichos estudios han sido realizados en humanos. Por ejemplo, Dixon y Holton (2009) llevaron a cabo un estudio donde se evaluó la preferencia de jugadores patológicos en una situación de elección intertemporal. En primera instancia, se evaluó la preferencia de los participantes en una condición en la que las alternativas LL y SS estaban relacionadas, cada una, con un estímulo neutral distinto; con un cuadrado rosa y un cuadrado morado, respectivamente. Posteriormente, se alteró la función de dichos estímulos relacionando al cuadrado rosa con respuestas correctas y al cuadrado morado con respuestas incorrectas en una tarea de igualación a la muestra. Después de dicho entrenamiento, se evaluó nuevamente la preferencia de los sujetos con los estímulos presentes y se encontró una mayor preferencia por la alternativa LL. Esto sugiere que la función de los estímulos relacionados con cada alternativa puede manipularse mediante el apareamiento con eventos significativos.

En el estudio de Dixon y Holton (2009) se obtuvo evidencia de que al manipular simultáneamente la función de los estímulos presentes en la alternativa LL y los estímulos presentes en la alternativa SS se puede modificar la preferencia de los individuos. Posiblemente, el motivo por el que en el presente estudio se encontró un efecto modesto (por lo menos, en el Experimento 1) fue haber manipulado solamente la función de los estímulos relacionados con la alternativa SS y no hacerlo en conjunto con los estímulos relacionados con la elección de la alternativa LL. Sin embargo, el presente experimento aporta controles que el estudio de Dixon y Holton (2009) no se implementan, como la evaluación entre grupos. Estos autores no evaluaron si el cambio en la preferencia en los participantes se debía al entrenamiento asociativo o al simple hecho de exponerse a la tarea de igualación a la muestra. Queda pendiente para una agenda de investigación a futuro diseñar nuevos experimentos que permitan evaluar con mayor rigor la hipótesis aquí planteada, para así poder apoyarla o refutarla de manera concluyente. Esto podría sumarse al cuerpo empírico mediante el que se construye la comprensión del fenómeno impulsividad/autocontrol.

REFERENCIAS

Ainslie, G. W. (1974). Impulse control in pigeons. Journal of the Experimental Analysis of Behavior, 21(3), 485-489. [ Links ]

Ainslie, G. (1975). Specious reward: A behavioral theory of impulsiveness and impulse-control. Psychological Bulletin, 82, 463-496. [ Links ]

Daly, H. B. & Daly, J. T. (1982). A mathematical model of reward and aversive nonreward: Its application in over 30 appetitive learning situations. Journal of Experimental Psychology: General, 111(4), 441- 480. [ Links ]

Dixon, M. R., & Holton, B. (2009). Altering the magnitude of delay discounting by pathological gamblers. Journal of Applied Behavior Analysis, 42 (2), 269–275.

Eisenberger, R. (1992). Learned industriousness. Psychological Review, 99(2), 248-267. [ Links ]

Eisenberger, R. & Adornetto, M. (1986). Generalized self-control of dalay and effort. Journal of Personality and Social Psychology, 51(5), 1020-1031. [ Links ]

Eisenberger, R. & Masterson, F. A. (1986). Required high effort increases subsequent persistence and reduces cheating. Journal of Personality and Social Psychology, 99, 593-599. [ Links ]

Eisenberger, R., Weier, F., Masterson, F. A., Theis, L. Y. (1989). Fixed ratio schedules increase generalized self-control: Preference for large rewards despite high effort or punishment. Journal of Experimental Psychology: Animal Behavior Processes. [ Links ]

Fantino, E. (1966). Immediate reward followed by extinction vs. later reward without extinction. Psychonomic Science, 6, 233-234. [ Links ]

Hulse, S. H. (1973). Reinforcement contrast effects in rats following experimental definition of reinforcement magnitude. Journal of Experimental and Physiological Psychology, 85(1), 160-170. [ Links ]

Logue, A. W. (1988). Research on self-control: An integrating framework. Behavior and Brain Science, 11, 665-709. [ Links ]

Leitenberg, H. (1965). Is time out from positive reinforcement an aversive event? Psychological Bulletin, 64(6), 428-441. [ Links ]

Mazur, J. E. (1995). Conditioned reinforcement and choice with delayed and uncertain primary reinforcers. Journal of the Experimental Analysis of Behavior, 63, 139–150.

McPherson, A. & Osborne, J. G. (1988). The emergence of establishing-stimulus control. Psychological Record, 36, 375-386. [ Links ]

Michael, J. (1993). Establishing operations. The Behavior Analyst, 16(2), 191-206. [ Links ]

Nevin, J. A. (1992). An integrative model for the study of behavioral momentum. Journal of the Experimental Analysis of Behavior, 57(3), 301-316. [ Links ]

Peters, H. L., Hunt, M., & Harper, D. N. (2004). Choice with initial and terminal link reinforcement: An alternative self-control paradigm. Journal of Experimental Psychology: Animal Behavior Processes, 30(1), 74-77. [ Links ]

Tryon, W. W. (1982). A simplified time-series analysis for evaluating treatment interventions. Journal of the Experimental Analysis of Behavior, 15(3), 423-429. [ Links ]

Wagner A. R. (1969). Frustrative nonreward: A variety of punishment? En Campbell B. A. & Church R. M. (Eds.), Punishment and aversive behavior (pp.157-181). New York: Appleton-Century-Crofts. [ Links ]

Wasserman, E. A., Franklin, S., and Hearst, E. (1974). Pavlovian appetitive contingencies and approach vs. withdrawal to conditioned stimuli in pigeons. Journal of Comparative and Physiological Psychology, 86, 616-627. [ Links ]

Zlomke, K. R., & Dixon, M. R. (2006). Modification of slot-machine preferences through the use of a conditional discrimination paradigm. Journal of Applied Behavior Analysis, 39, 351–361.

Received: October 03, 2013
Accepted: January 16, 2014

¹⁾ El presente trabajo forma parte de la tesis doctoral del primer autor. Dirigir correspondencia al correo electrónico: r.sosa.s1984@gmail.com
²⁾ El propósito de añadir el ruido blanco en ambas alternativas fue simular las situaciones de laboratorio en que se suele estudiar la elección intertemporal. En dichas situaciones, los estímulos que anteceden a la entrega de la recompensa en la alternativa SS (e.g., sonidos y vibraciones emitidas por el dispensador de agua o comida) son muy semejantes a los estímulos que anteceden la entrega del reforzador al final de la demora en la alternativa LL. De este modo, la intensión fue que el experimento mantuviera cierto grado de validez ecológica. Ciertamente, podría plantearse que de este modo es más difícil que el ruido blanco adquiera una función como estímulo aversivo puesto que, si bien se asocia con la ausencia de agua en la alternativa SS, también se relaciona con la entrega de agua en la alternativa LL. Sin embargo, es importante señalar que en cada caso existen condiciones de estímulo distintas que podrían modular la función del ruido blanco. La posibilidad de que esto suceda ha sido elaborada por Michael (1993), quien acuñó el término reforzamiento condicionado condicional, para denominar a este fenómeno. Más aún, se ha obtenido evidencia que respalda la posibilidad de que este fenómeno ocurre, al menos, en condiciones de laboratorio (e.g., McPherson & Osborne, 1986).