SciELO - Scientific Electronic Library Online

 
vol.19 issue3Conditioned Suppression With Different Aversive Stimuli: Electric Shock and Hot Air Blast author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Acta Comportamentalia

Print version ISSN 0188-8145

Acta comport. vol.19 no.3 Guadalajara Dec. 2011

 

 

¿Es la "abstención" de comer comida disponible un ejemplo de conducta autocontrolada en palomas?

Is "refraining" from eating free food a case of self-controlled behavior in pigeons?

 

 

Juan C. González; Raúl Ávila; Andrea Juárez; Patricia Miranda1

Universidad Nacional Autónoma de México Facultad de Psicología

 


RESUMEN

Se expuso a tres palomas privadas de comida a sesiones experimentales de 50 ciclos de 64 s cada uno (ciclos T) dentro de los que siempre se presentó un dispensador de comida durante 3 s (ER1). El dispensador se podía presentar nuevamente (ER2) cuando terminaba el ciclo si el sujeto se abstenía de aproximarse al ER1, de lo contrario, este se retiraba y se cancelaba la entrega del ER2. En cinco fases experimentales se presentó el ER1 3, 32, 16, 8, y 3 s antes del final del ciclo T. Además, conforme a un diseño ABA, un cambio de color en una tecla de respuesta señaló (A1 y A2) o no (B) las presentaciones del ER1 sirviendo como un operando distractor. Se encontró que el número de ER2 obtenidos disminuyó conforme el ER1 se presentó más cerca del inicio del ciclo T. Así mismo, se observó que únicamente durante las condiciones A de la primera fase experimental, el número de ER1 interrumpidos fue relativamente bajo y el número de picotazos a la tecla fue comparativamente mayor. Estos hallazgos reprodujeron y extendieron los resultados de otras investigaciones en las cuales se estudió la conducta autocontrolada de comer.

Palabras clave: ciclo T, presentación de comida, conducta de comer, autocontrol, palomas.mática.


ABSTRACT

Self-controlled eating behavior was studied in three food-deprived pigeons exposed to a procedure consisting on fifty 64-s time cycles (T cycles). In each cycle a food-hopper was always presented once for 3 s (SR 1 ) and could be presented for other 3 s (SR 2) after the T cycle elapsed, according to the following contingency. If the subject approached to SR 1 it was withdrawn and SR 2 delivery was cancelled; otherwise SR 2 was presented when the T cycle elapsed. In five experimental phases SR 1 was presented 3, 32, 16, 8, and 3 s before the end of the T cycle. Additionally, according to an ABA-design, a color change of a response key signaled (conditions A1 and A2) or not (condition B) SR 1 presentations and served as a distracting operandum. It was found that the number of SR 2 obtained was lower as SR 1 was presented closer to the beginning of each T cycle, regardless of signaling SR 1 presentations. It was also found that only in the A conditions of the first experimental phase (3 s) SR 1 interruptions were relatively low and R>0 of key pecks was comparatively high. Globally, these results replicated and extended those of previous studies in which self-controlled eating behavior was explored.

Keywords: T cycle, food presentation, eating behavior, self control, pigeons.


 

 

En una primera aproximación al estudio de la conducta autocontrolada, Cole, Coll y Schoenfeld (1982/1990) y Coll (1983) diseñaron un procedimiento para entrenar a palomas experimentalmente ingenuas y privadas de comida a alternar entre comer y no comer en presencia de comida. El procedimiento se puede describir como sigue: se programó un ciclo de tiempo repetitivo (ciclo T) conforme al cual se presentó el dispensador con alimento durante varios segundos una vez dentro de cada ciclo. Esta primera presentación del dispensador ocurrió independientemente de la conducta del sujeto y se denominó ER1. El dispensador se podía presentar de nuevo después de que terminaba el ciclo de tiempo (ER2) conforme a la siguiente contingencia. Aún cuando el sujeto podía consumir el ER1, si el sujeto se "abstenía" entonces se presentaba el ER2 y ahora sí podía consumir el alimento. Por el contrario, si el sujeto intentaba consumir el ER1 este último se retiraba y se cancelaba la presentación del ER2.

Tanto Coll como Cole, et al., sugirieron que alternar entre comer y no comer en presencia de comida era un ejemplo de la conducta autocontrolada que comúnmente se describe como "resistir" la tentación (e.g., Rachlin, 1974; Skinner, 1953). Así, en ambos estudios se averiguaron los efectos de una serie de variables sobre la adquisición y el mantenimiento de la conducta autocontrolada. Por ejemplo, Cole et al., expusieron a dos palomas privadas de alimento a un ciclo T constante en 63 s con presentaciones del ER1 en los últimos 3 s del ciclo y establecieron el criterio de obtener al menos el 80% de los reforzadores programados por sesión para afirmar que se había adquirido la conducta autocontrolada de comer. Encontraron que las dos palomas obtuvieron 6 y 26% de los ER 2 programados; esto es, los sujetos mostraron conducta impulsiva. Dados los resultados previos los autores expusieron a una tercera paloma al mismo procedimiento pero el ER 1 ocurrió 33 s antes del final del ciclo T y encontraron que el sujeto obtuvo 0% de los ER2 programados. A pesar de estos resultados negativos, la diferencia en el porcentaje de ER2 obtenidos entre los dos primeros sujetos y el tercero sugiere que la ubicación temporal del ER1 dentro del ciclo T puede ser una variable importante para adquirir la conducta de comer autocontrolada. Los autores sugirieron que, además de la ubicación temporal del ER1 dentro del ciclo T, podía ser necesaria una contingencia entre la emisión de una operante y la presentación del ER2 para establecer la conducta de comer autocontrolada.

En un estudio posterior, Coll (1983) empleó esencialmente el mismo procedimiento que Cole, et al., y averiguó la contribución de la contingencia respuesta-ER2 a la adquisición de la conducta autocontrolada en palomas. Específicamente, Coll entrenó a los sujetos a picar una tecla de respuesta para obtener comida como reforzador y posteriormente los expuso a ciclos T dentro de los cuales se presentó el ER1 independientemente de la conducta de los sujetos y si los sujetos se "se abstenían" de consumirlo entonces después de que terminaba el ciclo T podían picar la tecla para obtener el ER2. La autora manipuló la probabilidad de requerir el picotazo a la tecla después de que terminaba el ciclo T para entregar el ER2 y encontró que cuando esta última fue de 1.0 todos los sujetos adquirieron la conducta autocontrolada; se abstuvieron de consumir el ER1 en más del 80% de los ensayos. Por el contrario, cuando la probabilidad de requerir un picotazo a la tecla fue de 0.0, convirtiendo el procedimiento en uno de presentaciones del ER2 independientes de la conducta, el número de interrupciones del ER1 fue notablemente alto; la conducta autocontrolada de comer ocurrió infrecuentemente. Así, la autora concluyó que una contingencia respuesta- ER2 era necesaria para establecer y mantener la conducta de comer autocontrolada en palomas privadas de alimento.

Además de la contribución de la ubicación temporal del ER1 dentro del ciclo T y de la contingencia respuesta-ER2 a la adquisición de la conducta de comer autocontrolada, Cole et al., y Coll sugirieron que añadir la oportunidad de emitir una conducta incompatible con comer en presencia del ER1 podía facilitar la adquisición de la conducta autocontrolada. Por ejemplo, picar una tecla de respuesta iluminada que se presente al mismo tiempo que el ER1, podría ser una conducta distractora que facilite la adquisición y el mantenimiento de la conducta autocontrolada. Siguiendo este razonamiento, desde el punto de vista de los autores del presente estudio, es posible que la contingencia respuesta-ER2 más que ser necesaria para la adquisición de la conducta autocontrolada podría funcionar como una conducta distractora o incompatible con aproximarse al ER1.

De los estudios previamente descritos se deduce que es posible adquirir y mantener la conducta autocontrolada de comer en palomas privadas de comida. Sin embargo, los resultados de estos estudios fueron marginalmente consistentes intra y entre sujetos y pudieron ser consecuencia de combinaciones poco favorables de las variables involucradas en el procedimiento empleado. No obstante, por su naturaleza paramétrica, se puede examinar sistemáticamente la contribución de las variables involucradas en el procedimiento a la ocurrencia del fenómeno. Así, en el presente estudio se averiguaron los efectos de variar la ubicación temporal del ER1 dentro del ciclo T y de añadir una tecla en presencia del ER1 sobre la ocurrencia de la conducta de comer autocontrolada, en palomas privadas de alimento y expuestas a un procedimiento de reforzamiento independiente de la conducta.

 

MÉTODO

Sujetos

Sirvieron como sujetos tres palomas experimentalmente ingenuas y de cuatro años de edad al inicio de la investigación. Se mantuvo a los sujetos al 80% de su peso en alimentación libre y se alojaron en jaulas individuales con acceso libre a agua durante todo el experimento.

Aparatos

Se usaron tres cajas experimentales para palomas (Med Assoc. Mod. ENV-007) equipadas con un dispensador de comida (Med Assoc. Mod. ENV-205 M) y tres teclas de respuesta (Med Assoc. Mod. ENV-123 AM) cada una. Únicamente la tecla derecha fue operativa para registrar los picotazos y se podía iluminar con una luz roja o una luz verde, dependiendo de las condiciones experimentales. En las paredes del orificio a través del cual se presentaba el dispensador de comida se montó un fotoreceptor para registrar las veces que el sujeto metía la cabeza al dispensador para consumir grano mezclado. En la pared opuesta de la caja experimental se colocó un foco que proporcionó la iluminación general de la caja (Med Assoc. Mod. ENV-215 M). Cada caja experimental se colocó dentro de una caja a prueba de ruidos (Med Assoc. Mod. ENV-018 MD) con un ventilador que proveía ruido blanco. Las cajas estaban en un cuarto contiguo al laboratorio como una precaución extra para evitar ruidos externos. Las cajas experimentales se conectaron a través de una interface Med Assoc. a una computadora personal (Compaq). Se usó el lenguaje de programación Med-PC IV para presentar los eventos experimentales y registrar los datos correspondientes.

Procedimiento

Entrenamiento preliminar

En dos sesiones de una hora cada una, se entrenó a las palomas a comer del dispensador de comida con el siguiente procedimiento. Al principio de cada sesión se presentó el dispensador durante 12 s cada 60 s y después de que el sujeto se aproximaba al mismo y comía en cuatro ocasiones consecutivas, en las siguientes presentaciones se disminuía su duración en 1 s. Así, se acortó el tiempo que el dispensador estaba presente de 12 a 4 s y se mantuvo constante en esta duración hasta el final de la sesión.

Posteriormente, se entrenó a las palomas a picar la tecla derecha de la caja experimental usando un procedimiento de automoldeamiento (Brown & Jenkins, 1968, procedimiento 8). Específicamente, se programó un intervalo entre ensayos de 60 s señalado con la iluminación de la tecla derecha en rojo, seguido por un ensayo que consistió en un cambio de iluminación de la tecla de rojo a verde (estímulo) y la subsecuente entrega de comida durante 3 s. En dos bloques de 10 sesiones cada una, se estableció la duración del estímulo en 8 y después en 4 s y cada sesión terminó después de 50 ensayos.

Entrenamiento en autocontrol

Se expuso a los sujetos al siguiente procedimiento. Cada sesión experimental se dividió en 50 ciclos de tiempo repetitivo (ciclos T) de 64 s cada uno y el dispensador de comida se presentó durante 3 s una vez dentro de cada ciclo T (ER1). El dispensador de comida se podía presentar de nuevo después de que el ciclo T terminaba (ER2), de acuerdo a la siguiente contingencia. Si durante la presentación del ER1 el sujeto interrumpía el haz de luz del fotoreceptor éste último se retiraba y se cancelaba la entrega del ER2. Por el contrario, si el sujeto no interrumpía el haz de luz del fotoreceptor entonces se presentaba el ER2 cuando terminaba el ciclo T.

Manteniendo constante la contingencia previa, en una primera fase experimental el ER1 ocurrió en los últimos 3 s del ciclo T. En cuatro fases posteriores el ER1 se presentó 32, 16, 8 y 3 s antes del final del ciclo. En cada fase se programaron tres condiciones experimentales sucesivas en las cuales la iluminación de la tecla derecha cambió de rojo a verde durante 3 s (EN) concurrentemente con la presentación del ER1 (condiciones A1 y A2), o el color de la tecla se mantuvo constante en rojo durante todo el ciclo T (condición B). Cada condición experimental estuvo en efecto durante 20 sesiones.

 

RESULTADOS

En la Figura 1 se muestra el número de ER2 obtenidos en las sesiones consecutivas de exposición a cada fase experimental (columnas) y para cada sujeto (filas).

 

 

En la primera fase experimental, cuando el ER1 se presentó junto con el EN por primera vez en los últimos 3 s del ciclo T (Condición A1), se encontró que para los sujetos R1 y R2 el número de ER2 obtenidos varió entre 40 y 50, que era el máximo posible por sesión. Retirar el EN (Condición B) resultó en una disminución abrupta del número de interrupciones que aumentó gradualmente para el sujeto R1 y permaneció estable para el sujeto R2, conforme transcurrieron las sesiones de exposición a esta condición. Volver a presentar el EN (Condición A2) resultó de nuevo en un número de ER2 obtenidos cercano a 50 por sesión. Para el sujeto R3 el número de ER2 obtenidos por sesión varió entre 40 y 50 en las tres condiciones de esta primera fase experimental.

Presentar el ER1 32 s antes del final del ciclo T resultó en un número de ER2 obtenidos que varió entre 10 y 0 para los sujetos R1 y R3 y en un rango que varió entre 30 y 10 interrupciones por sesión para el sujeto R2. En los tres sujetos los cambios de la variable dependiente ocurrieron independientemente de presentar o no el EN junto con el ER1.

En la tercera fase experimental y como en la fase anterior, independientemente de la presencia o ausencia del EN, presentar el ER1 16 s antes del final del ciclo T resultó en un número de ER2 obtenidos muy variable sin una tendencia clara para los sujetos R1 y R3 y en un nivel similar al observado en la fase previa para el sujeto R2.

Presentar el ER1 8 s antes del final del ciclo T resultó en un patrón de ER2 obtenidos similar al observado en la fase previa para los sujetos R1 y R3 y en un patrón similar a las de estos sujetos en el caso de R2.

Finalmente, el patrón de interrupciones que se observó en la primera exposición del ER1 en los últimos 3 s del ciclo T se reprodujo en la segunda exposición a esta fase experimental pero sólo para el sujeto R2; esto es, un número de ER2 obtenidos cercano al máximo posible de 50 por sesión, cercano a 0 y de nuevo cercano a 50 en las tres condiciones experimentales. En los sujetos R1 y R3 se observó un número similar de ER2 obtenidos a los de la fase experimental previa, independientemente de la presencia del EN.

En la Figura 2 se muestra el número de ER1 interrumpidos (rombos) y el número de presentaciones del EN en las que ocurrió al menos un picotazo (R>0, círculos vacíos) para las sesiones consecutivas de exposición a cada fase experimental (columnas) y para cada sujeto (filas).

 

 

Para cada fase experimental la primera y tercera columna muestran las variables dependientes para la presentación de ambos, el ER1 y el EN (condiciones A1 y A2 respectivamente). En las condiciones B se omitió la presentación del EN y por esta razón no se registraron picotazos durante el estímulo. Por claridad, en estas condiciones también se omitieron los datos del número de ER1 interrumpidos, pero se dejó el espacio correspondiente para mantener la secuencia de las condiciones del diseño del experimento.

Para la primera fase experimental en la que el ER1 se presentó 3 s antes de que el ciclo T terminara y fue acompañado por el EN (condiciones A), el número de ER1 interrumpidos varió entre 0 y 10 en la mayoría de las sesiones para los tres sujetos. Con respecto a R>0, sólo para el sujeto R2 la variable fue claramente más alta que el número de ER1. Para R1 y R2 se observó que R>0 fue un poco mayor que el número de ER1 en la mayoría de las sesiones. En la siguiente fase experimental, cuando el ER1 se presentó 32 s antes del fin del ciclo T, los tres sujetos interrumpieron casi todas las presentaciones del ER1 y casi en ninguna sesión picaron la tecla en presencia del EN. En las dos fases experimentales siguientes cuando el ER1 se presentó 16 y 8 s antes del final del ciclo T, el número de ER1 interrumpidos disminuyó gradualmente para los sujetos R1 y R2 o se mantuvo en un nivel comparativamente bajo y variable para el sujeto R3. Para estas mismas fases, R>0 permaneció en un nivel muy bajo para los tres sujetos. En la quinta fase experimental, cuando el ER1 se presentó de nuevo 3 s antes del final de ciclo T, el número de ER1interrumpidos fue relativamente variable y R>0 permaneció en cero o a un nivel bajo para los sujetos R1 y R3. Para el sujeto R2 el número de interrupciones al ER1 fue cercano a cero y R>0 fue comparativamente alto, igual que en la primera condición experimental.

 

DISCUSIÓN

En el presente experimento se averiguaron los efectos de variar la ubicación temporal de una recompensa (ER1) dentro de un ciclo T y los efectos de presentar o no un estímulo (EN) concurrentemente con la disponibilidad del ER1, ambos sobre el establecimiento y mantenimiento de la conducta de comer autocontrolada en palomas privadas de alimento; e.g., no comer en presencia de comida libremente disponible. Dado el diseño del experimento, para cada posición temporal del ER1 se probó el efecto de presentar o no el EN concurrentemente con el ER1. Por lo tanto, primero se discutirán los efectos de variar la ubicación temporal del ER1 y después la contribución de señalar o no las presentaciones del mismo sobre el número de ER2 obtenidos (Figura 1). Posteriormente, se comentarán en el mismo orden los efectos de las variables sobre el número de ER1 interrumpidos y el número de presentaciones del EN con al menos un picotazo (Figura 2).

Con respecto a la ubicación temporal del ER1 dentro del ciclo T (independientemente de la presencia o ausencia del EN junto con el ER1) se encontró que el número de ER2 obtenidos fue progresivamente mayor conforme el ER1 se presentó más cerca del final del ciclo T. Este hallazgo reprodujo y extendió los efectos de la misma variable que reportaron Cole, et al., quienes encontraron que para dos sujetos presentar el ER1 en los últimos 3 s de un ciclo T constante en 60 s resultó en un porcentaje de ER2 ganados de 6 y 26% y para un tercer sujeto presentar el ER1 a la mitad del ciclo T resultó en 0% de ER2 ganados. Este hallazgo sugirió un efecto decreciente de variar la ubicación temporal del ER1 dentro del ciclo T sobre la ocurrencia de la conducta autocontrolada; efecto que se confirmó en el presente experimento y se extendió a más valores de la variable independiente.

Variar la ubicación temporal del ER1 dentro de un ciclo T, es una manipulación comparable con la implementada en los procedimientos de estímulo intrusivo del condicionamiento operante y del condicionamiento Pavloviano. En estos procedimientos se añade un estímulo neutral a un patrón de conducta controlado por un programa de reforzamiento dado y se varía sistemáticamente su ubicación temporal entre reforzadores sucesivos. Se ha mostrado que un estímulo inicialmente neutral puede controlar confiablemente la ocurrencia antes, durante y después de su presentación, del picoteo a la tecla operante (Farmer & Schoenfeld, 1966), el picoteo a la tecla automoldeado (Bruner, 1981), el consumo de agua en presencia de una oportunidad para beber (Ávila & Bruner, 1994), la actividad general en ratas (Bruner, Gallardo & Ávila, 2002), etc. En estos procedimientos el estímulo se presenta independientemente de la conducta del sujeto y globalmente se ha encontrado que dependiendo de su ubicación temporal dentro del intervalo entre reforzadores el estímulo intrusivo controla diferentes porciones del patrón de conducta definido por el programa de reforzamiento. Estas porciones pueden consistir en tasas altas, medianas o bajas de la operante registrada. Por ejemplo, en el caso del picoteo a la tecla automoldeado, conforme se aleja el estímulo de la entrega del reforzador, los animales pican la tecla cada vez menos frecuentemente. En el procedimiento empleado en este estudio el ER1 sirvió como estímulo intrusivo y se explicitó una contingencia negativa entre aproximarse al ER1 y cancelar la presentación del ER2 al terminar el ciclo T. Así, el ER1 pudo funcionar como un estímulo negativo para la conducta de aproximarse al dispensador e intentar consumir la comida. Como se mostró en la sección de resultados, los sujetos se aproximaron más al dispensador conforme el ER1 se presentó cada vez más alejado del final del ciclo. Es posible que este resultado se debiera a que el ER1 perdió su control como estímulo negativo sobre la ocurrencia de la conducta consumatoria. Conforme a esta explicación se puede sugerir que la conducta autocontrolada definida como abstenerse de consumir una recompensa presente, hasta que se cumple algún criterio preestablecido se puede reducir al entrenamiento en discriminación entre consumir y no consumir comida libremente disponible en presencia de un estímulo.

Con respecto a la variable de señalar o no la presentación del ER1 se encontró lo siguiente. Los efectos de presentar el EN junto con el ER1 sobre el número de ER2 obtenidos por sesión fueron modulados por la ubicación temporal del ER1 dentro del ciclo T de la siguiente manera. En la primera fase experimental, para los sujetos R1 y R2 se encontró que cuando el ER1 se presentó en los últimos 3 s del ciclo T, señalar su presentación (Condiciones A1 y A2) resultó en un número de ER2 obtenidos cercano al máximo posible y notablemente más alto que el obtenido cuando no se señaló la presentación del ER1 (Condición B). Para el sujeto R3 la variable dependiente se mantuvo en un nivel por arriba del 80% independientemente de la presencia o ausencia del EN. Las disminuciones o los aumentos en el número de ER2 obtenidos que se observaron en las demás posiciones temporales del ER1 dentro del ciclo T, fueron independientes de presentar o no el EN junto con el ER1. Estos resultados sugieren que el EN perdió control sobre el responder en su presencia, igual que en cualquier otro procedimiento de estímulo intrusivo (e.g., Farmer & Schoenfeld, 1966), en función de alejarlo de la presentación del reforzador al final del ciclo T.

A continuación se discutirán los cambios en el número de ER1 interrumpidos y el número de presentaciones del EN con al menos una respuesta (R>0), en función de las mismas variables independientes que se describieron en la primera parte de esta sección. La importancia de estas variables dependientes es que pueden clarificar la contribución de agregar una tarea distractora en esta clase de procedimientos de autocontrol. La premisa principal de mantener una tecla iluminada es que los sujetos pueden emitir una actividad distractora en presencia del ER1; por ejemplo picar la tecla en lugar de aproximarse al ER1 y así ganar el máximo posible de ER2 al final del ciclo T. Así, en principio se debería facilitar la adquisición de la conducta autocontrolada de abstenerse de consumir la recompensa.

Cole, et al., y Coll sugirieron que en un procedimiento de autocontrol similar al usado en el presente estudio, la conducta de "esperar" podría significar que los sujetos estaban haciendo algo más mientras el reforzador estaba disponible pero no se podía consumir. Los autores no probaron directamente esta sugerencia, pero Grosch y Neuringer (1981) quienes emplearon el procedimiento de elección para estudiar autocontrol, reportaron datos que pueden ser pertinentes a este argumento. Los autores entrenaron a palomas a "elegir" entre una comida "preferida" y otra menos "preferida" y a "esperar" por la comida "preferida" en la presencia de ambos tipos de comida. Encontraron que añadir un operando distractor resultaba en un incremento notable del número de entregas de comida "preferida" en comparación con una condición en la que el operando "distractor" estaba ausente; esto es, los sujetos mostraron conducta autocontrolada.

Para todas las fases del presente experimento, en dos condiciones no sucesivas se señaló con un cambio de color en una tecla las presentaciones del ER1. Esta tecla iluminada o EN pudo funcionar como un operando "distractor" como en el experimento de Grosch y Neuringer. Así, en este estudio se comparó R>0 con el número de ER1 interrumpidos para todas las ubicaciones temporales del mismo dentro del ciclo T. Mientras que el número de ER1interrumpidos fue una función decreciente de variar su ubicación temporal del final al principio del ciclo T, R>0 fue cercano a cero cuando hubo un periodo de huella después de la presentación del ER1. Sin embargo, el número de ER1 interrumpidos y R>0 permanecieron en un nivel relativamente bajo y alto respectivamente, en la primera y quinta fase experimental en las que el ER1 se presentó en los últimos 3 s del ciclo T. De los datos de estas dos fases, se puede sugerir que mientras los sujetos estaban picando la tecla no estaban interrumpiendo el fotoreceptor. Estos resultados, replicaron y extendieron los resultados reportados por Grosch y Neuringer de un procedimiento de elección a un paradigma de conducta de comer autocontrolada. Aún más, se confirmó la sugerencia de Cole, et al., y de Coll de que establecer una conducta incompatible con la conducta de comer facilitaría la adquisición y el mantenimiento de la conducta de comer autocontrolada.

Una explicación de estos resultados es que, dado que picar la tecla resultó en un número bajo de ER1 interrumpidos y, en consecuencia, un número relativamente alto de ER2 obtenidos, estos últimos reforzaron supersticiosamente a los picotazos a la tecla (cf. Skinner, 1948). Un argumento en contra de esta explicación es que la variabilidad intra y entre sujetos en la frecuencia del picoteo a la tecla difícilmente confirma su mantenimiento por las contigüidades accidentales entre su ocurrencia y la entrega del ER2. Sin embargo, es posible que el ER2 reforzara supersticiosamente cualquier conducta diferente de interrumpir el ER1, incluyendo el picar la tecla. Esta interpretación es congruente con la reportada en estudios en los cuales la disponibilidad de una respuesta alternativa incrementó la probabilidad de reforzamiento en programas que requerían que el sujeto demorara su respuesta o se "abstuviera" de responder (e.g., Schwartz & Williams, 1971; Williams & Williams, 1969; Zuriff (1969). Por ejemplo, Williams y Williams (1969) expusieron a palomas privadas de alimento a un procedimiento de ensayo por ensayo en el que la iluminación intermitente de una tecla de respuesta fue seguida por comida, independientemente de la conducta del sujeto, pero el primer picotazo a la tecla apagaba la luz de la misma y cancelaba la entrega de la comida. Manteniendo esta contingencia vigente los autores, en su Experimento 3, añadieron una tecla "irrelevante" que los sujetos podían picar sin consecuencias programadas. Encontraron que los sujetos se "abstuvieron" de picar la tecla operativa más frecuentemente cuando estaba presente la tecla irrelevante que en su ausencia y sugirieron que el picoteo a la tecla "irrelevante" se pudo mantener por el reforzamiento adventicio del mismo. Schwartz y Williams expusieron a palomas a un procedimiento de ensayo discreto en el cual se reforzaron sólo los picotazos a una tecla operativa espaciados por al menos 6 s. Encontraron que después de 45 sesiones de 50 ensayos cada uno los sujetos cumplieron el requisito en 10% o menos de los ensayos. Posteriormente, los autores añadieron una tecla alternativa y operativa para registrar picotazos pero sin consecuencias programadas y encontraron que los sujetos cumplieron el criterio en 75% o más de los ensayos. Los autores sugirieron que los sujetos podían "abstenerse" exitosamente de responder en este tipo de procedimientos de reforzamiento del responder espaciado sólo cuando otro estímulo correlacionado con el reforzador está disponible para responder en él. Así, se enfatizó la importancia de una conducta colateral para mediar la ejecución espaciada de los sujetos. Aún cuando los autores no explicaron directamente la adquisición y el mantenimiento de la conducta colateral de picar una tecla sin consecuencias programadas, es viable sugerir que, igual que en el estudio de Williams y Williams, el responder colateral se mantuvo por su relación supersticiosa con la entrega del reforzador después de cumplir la contingencia especificada en la tecla operativa. En breve, en el procedimiento de automantenimiento negativo y en el procedimiento de reforzamiento del responder espaciado, se mostró que una conducta colateral era necesaria para cumplir una contingencia entre una operante y la entrega del reforzador. En el presente estudio se demostró la necesidad de explicitar conducta colateral para cumplir un requisito de "abstenerse" de emitir la conducta consumatoria de consumo de comida, como un caso de conducta autocontrolada.

Un argumento final respecto del papel de la tecla distractora en el presente estudio es que posiblemente sólo facilitó la adquisición de la conducta autocontrolada en la primera fase experimental, cuando el ER1 ocurrió en los últimos 3 s del ciclo T. Sin embargo, alargar el intervalo entre la presentación del ER1 y el ER2 diluyó el efecto de añadir la tecla distractora sobre las variables dependientes registradas en el estudio. Así, la proximidad temporal entre el ER1 y el ER2 es la variable que explica el mantenimiento de un número relativamente alto de ER2 obtenidos; que se acerca al criterio establecido por Cole et al., y Coll de 80% de los reforzadores obtenidos para afirmar que ocurrió la conducta autocontrolada de "abstenerse" de consumir comida disponible. Siguiendo este argumento, los resultados de este experimento también se podrían explicar en términos de un gradiente de demora del reforzamiento, igual que cualquier otra conducta operante cuya frecuencia disminuye conforme se alarga el intervalo entre su ocurrencia y la entrega del reforzador que la mantiene (cf. Skinner, 1938; Renner, 1964; Tarpy & Sawabini, 1974).

Además de las comparaciones previamente mencionadas, otra contribución de este estudio se refiere a que se clarificó el papel de la contingencia operante respuesta–reforzador en la adquisición y mantenimiento de la conducta autocontrolada. Con respecto a esta contingencia Coll (1983) expuso a palomas a un procedimiento similar al usado por Cole et al., y averiguó los efectos de variar la probabilidad de requerir un picotazo a una tecla de respuesta para entregar el ER2 y la probabilidad de presentar el ER2 después de que ocurrió la respuesta. La autora encontró que cuando estas probabilidades se establecieron en 1.0, todos los sujetos obtuvieron casi el 100% de los ER2 programados; esto es, los sujetos mostraron conducta de comer autocontrolada. Disminuir la probabilidad de requerir la operante o de presentar el ER2 resultó en un porcentaje progresivamente menor de ER2 obtenidos. La autora explicó estos resultados en términos de que es necesario reforzar la conducta de "abstenerse" de consumir el ER1 con la presentación del ER2 y la necesidad de explicitar una operante para producir la presentación del ER2 durante la adquisición de la respuesta autocontrolada. En las condiciones con EN ausente de la primera y última fase experimental del presente estudio se reprodujeron las condiciones en las cuales la probabilidad de requerir un picotazo a la tecla para entregar el ER2 se estableció en 0.0 y la probabilidad de presentar el ER2 se estableció en 1.0 del estudio de Coll. Se encontró que el número de ER2 obtenidos permaneció más o menos en el mismo nivel en las dos exposiciones a las condiciones mencionadas previamente. Estos resultados replicaron los reportados por Coll y se extendió el procedimiento de autocontrol de uno en el que era necesaria una contingencia respuesta-reforzador para adquirir la conducta de comer autocontrolada a un procedimiento en el cual todos los eventos experimentales ocurrieron independientemente de la conducta del sujeto de picotear la tecla.

Rachlin (1974) describió el procedimiento empleado en el presente estudio como autocontrol de "fuerza bruta" o simplemente rechazar una tentación presente y sugirió que "la causa directa de tal conducta es la correlación a largo plazo entre la conducta y sus consecuencias" (p. 100) y no el resultado de contingencias específicas entre ocurrencias aisladas de ejemplos de conducta y de consecuencias. Conforme a esta sugerencia los resultados de este experimento, al menos con respecto al número de ER1 interrumpidos, se pueden explicar en términos de la tasa de ER2 obtenidos; una tasa de ER2 obtenidos relativamente alta debería correlacionar con un número relativamente bajo de ER1interrumpidos. Sin embargo, dado que en el presente experimento se estableció una contingencia entre no interrumpir la presentación del ER1 y obtener el ER2, la explicación previa resulta circular y de poca utilidad para entender la conducta autocontrolada de "abstenerse" de consumir una recompensa hasta que se cumple un criterio externo.

Independientemente de la viabilidad de la explicación previa de los datos de este experimento, es interesante notar que Rachlin sugirió que el autocontrol de "fuerza bruta" es un caso especial del paradigma general de autocontrol conceptualizado como la elección entre pares de recompensas que varían en magnitud y demora de entrega. Conforme a este último paradigma la conducta autocontrolada se conceptualiza como emitir una respuesta que resulta en una recompensa grande pero demorada en lugar de emitir una respuesta diferente que resulta en un reforzador pequeño pero inmediato (cf. Rachlin, 2000; para una descripción reciente sobre autocontrol). En este caso la ocurrencia de la conducta consumatoria una vez que se obtiene la recompensa se asume como garantizada. Para los autores del presente estudio, los dos paradigmas son complementarios en el sentido que destacan diferentes aspectos de la clase de interacciones conducta -ambiente que se denomina autocontrol. En particular el paradigma de elección destaca la emisión de conducta operante que procura recompensas de diferente magnitud o demora de entrega. En comparación el paradigma de autocontrol empleado en este estudio enfatiza la conducta consumatoria que emite el sujeto para consumir la recompensa obtenida. Aún más, en ambos paradigmas el sujeto tiene que esperar para consumir la recompensa pero hay una diferencia básica entre los dos en las condiciones que prevalecen durante el periodo de espera. En el caso de elección el sujeto espera en la ausencia del reforzador y en el paradigma de autocontrol el sujeto espera en la presencia de la recompensa. Como Rachlin afirmó, en los dos paradigmas está involucrado el aspecto temporal de la relación entre la conducta operante o la consumatoria y la entrega de las recompensas. Conforme a este punto de vista, el paradigma de autocontrol que sugirió Schoenfeld y sus colaboradores, y se empleó en el presente estudio, y el paradigma de autocontrol como un caso de elección tal como lo presentó Rachlin son complementarios en términos de los aspectos de la conducta autocontrolada, operante o consumatoria, que cada uno destaca y en términos del énfasis de cada uno en las variables temporales involucradas en el fenómeno del autocontrol.

Sobre el efecto de variar la ubicación del ER1 dentro del ciclo T, es posible conceptualizar el procedimiento de elección en el que hay una demora entre cumplir un requisito, emitir una conducta, y la entrega del reforzador como un procedimiento análogo al empleado en el presente estudio por la siguiente razón. En el presente experimento se manipularon cuatro ubicaciones temporales del ER1 que podrían ser conceptualizadas como la demora entre cumplir, al igual que en el procedimiento de elección, el requisito de esperar en presencia de comida, y la entrega del reforzador. Se encontró, al igual que en otros procedimientos de autocontrol, que aumentar la demora incrementó la conducta impulsiva, en este caso el número de interrupciones al ER1; en cambio disminuir la demora resultó en un decremento del número de interrupciones al ER1 y, por lo tanto, en un mayor número de reforzadores ganados.

Estos dos paradigmas de autocontrol pueden extenderse a situaciones en las cuales durante el periodo de "espera", en presencia o ausencia del reforzador, el sujeto tiene que completar un requisito de un número de respuestas para tener acceso al reforzador. Por ejemplo, Mahoney y Bandura (1972) entrenaron a palomas privadas de alimento a picar una tecla repetidamente en presencia de comida para tener acceso a esta. Si las palomas intentaban consumir la comida sin cumplir el requisito, esta se retiraba, el sujeto ya no podía consumirla y empezaba un nuevo ensayo. En fases experimentales posteriores los autores probaron el efecto de retirar la contingencia entre picar la tecla y obtener acceso al reforzador sobre el número de veces que las palomas picaban a la tecla antes de intentar consumir la comida. En general, encontraron que era posible entrenar a las palomas a cumplir requisitos pequeños o grandes para poder obtener acceso a la comida. Sin embargo, quitar la contingencia resultó en una disminución abrupta del número de veces que las palomas picaron a la tecla antes de intentar consumir la comida. Los autores interpretaron este resultado en términos del concepto de auto reforzamiento el cual se refiere simplemente al hecho de que los animales cumple un requisito de respuestas antes de accesar al reforzador en presencia del mismo.

Mahoney y Bandura, entrenaron a palomas a cumplir un requisito de respuestas antes de consumir la recompensa. Sin embargo, cuando quitaron la contingencia el número de picotazos antes de consumir la recompensa que ya está disponible, disminuyó rápidamente hasta que los animales consumieron la comida sin emitir ninguna respuesta. En términos estrictos, el presente experimento no es uno de autoreforzamiento pero es posible hacer algunas comparaciones. Durante la primera y quinta fase experimental, que son comprables con el procedimiento de Mahoney y Bandura, los autores de este estudio lograron establecer la conducta de esperar en presencia de una recompensa sin establecer una contingencia respuesta-reforzador. También se observó que al menos dos de tres sujetos mantuvieron la conducta de picar a la tecla durante la presentación del ER1. Los resultados de este experimento son similares a los de Mahoney y Bandura dado que las palomas picaron a la tecla por lo menos una vez antes de intentar comer y mantuvieron constante este patrón. Por otro lado, aún cuando en algunas ocasiones las palomas picaron la tecla con una frecuencia baja o nula, se abstuvieron de interrumpir el ER1. Este resultado se podría caracterizar como una extensión de la conducta de autoreforzamiento en el sentido de que las palomas pudieron "autoreforzarse" al emitir otra clase de conducta antes de intentar comer. Sin embargo, desde el punto de vista de los autores del presente estudio es más importante notar las contigüidades cuantitativas entre el procedimiento del estudio de Mahoney y Bandura y el del presente estudio (cf. Sidman, 1969). Conforme a estas contigüidades se podrían sistematizar todos los ejemplos de conducta que ocurren en presencia de una recompensa antes de consumir esta última, identificados actualmente como autocontrol, conducta colateral, "autoreforzamiento", etc.

 

Referencias

Ávila, R., & Bruner, C. A. (1994). Varying the temporal placement of a drinking opportunity in a fixed interval schedule. Journal of the Experimental Analysis of Behavior, 62, 307314.         [ Links ]

Brown, P. L., & Jenkins, H. M. (1968). Auto-shaping of the pigeon's key-peck. Journal of the Experimental Analysis of Behavior, 11, 1-8.         [ Links ]

Bruner, C. A. (1981). The effect of cycle length, interstimulus interval and probability of reinforcement in autoshapingautomaintenance. Revista Mexicana de Análisis de la Conducta, 7, 149157.         [ Links ]

Bruner, C. A., Gallardo, L. M., & Ávila, R. (2002). Variaciones en la ubicación temporal de una señal dentro de un ciclo de reforzamiento independiente de la respuesta sobre la actividad de las ratas. Revista Mexicana de Análisis de la Conducta, 28, 3-18.         [ Links ]

Cole, B. K., Coll, G., & Schoenfeld, W. N. (1982/1990). Análisis experimental del autocontrol. Trabajo presentado en el primer Simposio Bienal sobre la Ciencia de la Conducta, Febrero 12-14 1982, ENEP Iztacala, UNAM. Publicado en: Ribes, E., & Harzem, P. (Eds.), Lenguaje y conducta (169-192). México: Trillas.         [ Links ]

Coll, G. (1983). Investigation of two parameters that establish self-control eating in the pigeon. Unpublished doctoral dissertation, City University of New York, New York.

Farmer, J., & Schoenfeld, W. N. (1966). Varying temporal placement of an added stimulus in a fixed-interval schedule. Journal of the Experimental Analysis of Behavior, 9, 369-375.         [ Links ]

Mahoney, M. & Bandura, A. (1972). Self-reinforcement in pigeons. Learning and motivation,3, 293-303.         [ Links ]

Grosch, J., & Neuringer, A. (1981). Self-control in pigeons under the Mischel paradigm. Journal of the Experimental Analysis of Behavior, 35, 3-21.         [ Links ]

Rachlin, H. (1974). Self-control. Behaviorism, 2, 94-107.         [ Links ]

Rachlin, H. (2000). The Science of Self-Control. Cambridge, MA: Harvard University Press.         [ Links ]

Renner, K. E. (1964). Delay of reinforcement: a historical review. Psychological Bulletin, 61, 341-361.         [ Links ]

Schwartz, B., & Williams, D. R. (1971). Discrete-trial spaced responding in the pigeon: the dependence of efficient performance on the availability of a stimulus for collateral pecking. Journal of the Experimental Analysis of Behavior, 16, 155-160.         [ Links ]

Sidman, M. (1960). Tactics of scientific research. New York Appleton Century Crofts.         [ Links ]

Skinner, B. F. (1938). The behavior of the organisms. New York: Appleton-Century Croft.         [ Links ]

Skinner, B.F. (1948). Superstition in the pigeon. Journal of Experimental Psychology, 38, 168-172.         [ Links ]

Skinner, B. F. (1953). Science and human behavior. New York: Appleton-Century Croft.         [ Links ]

Tarpy, R. M., & Sawabini, F. L. (1974). Reinforcement delay: a selective review of the last decade. Psychological Bulletin, 81, 984-997.         [ Links ]

Williams, D. R., & Williams, H. (1969). Auto-maintenance in the pigeon: sustained pecking despite contingent non-reinforcement. Journal of the Experimental Analysis of Behavior, 12, 511-520.         [ Links ]

Zuriff, G.E. (1969). Collateral responding during differential reinforcement of low rates. Journal of the Experimental Analysis of Behavior, 12, 971-976.         [ Links ]

 

 

Received: April 01, 2010;
accepted: June 30, 2011

 

 

1) Este manuscrito es una versión corta de la tesis de Licenciatura que el primer autor presentó en la Facultad de Psicología de la UNAM y el segundo autor fue el director de tesis. El experimento se condujo con el apoyo de los proyectos PAPIIT IN 303007 e IN303909. El primer autor recibió beca de terminación de estudios y de elaboración de tesis de estos proyectos, respectivamente. Los autores agradecen a Hilda Palacios y a Sandra Avilés su ayuda en la conducción del experimento. Los autores pueden ser contactos en Laboratorio de Análisis Experimental de la Conducta, Edificio C, 2do. Piso, Cubículo 6. Facultad de Psicología, Universidad Nacional Autónoma de México. Av. Universidad 3004, México, D.F. 04510. Correo electrónico: jc_gonzalez16@ yahoo.com.ar ó raulas@servidor.unam.mx

Creative Commons License