¿Es la "abstención" de comer comida disponible un ejemplo de conducta autocontrolada en palomas?

González, Juan C.; Ávila, Raúl; Juárez, Andrea; Miranda, Patricia

Services on Demand

article

Automatic translation

Indicators

Access statistics

Permalink

Acta Comportamentalia

Print version ISSN 0188-8145

Acta comport. vol.19 no.3 Guadalajara Dec. 2011

¿Es la "abstención" de comer comida disponible un ejemplo de conducta autocontrolada en palomas?

Is "refraining" from eating free food a case of self-controlled behavior in pigeons?

Juan C. González; Raúl Ávila; Andrea Juárez; Patricia Miranda¹

Universidad Nacional Autónoma de México Facultad de Psicología

RESUMEN

Se expuso a tres palomas privadas de comida a sesiones experimentales de 50 ciclos de 64 s cada uno (ciclos T) dentro de los que siempre se presentó un dispensador de comida durante 3 s (E^R₁). El dispensador se podía presentar nuevamente (E^R₂) cuando terminaba el ciclo si el sujeto se abstenía de aproximarse al E^R₁, de lo contrario, este se retiraba y se cancelaba la entrega del E^R₂. En cinco fases experimentales se presentó el E^R₁ 3, 32, 16, 8, y 3 s antes del final del ciclo T. Además, conforme a un diseño ABA, un cambio de color en una tecla de respuesta señaló (A1 y A2) o no (B) las presentaciones del E^R₁ sirviendo como un operando distractor. Se encontró que el número de E^R₂ obtenidos disminuyó conforme el E^R₁ se presentó más cerca del inicio del ciclo T. Así mismo, se observó que únicamente durante las condiciones A de la primera fase experimental, el número de E^R₁ interrumpidos fue relativamente bajo y el número de picotazos a la tecla fue comparativamente mayor. Estos hallazgos reprodujeron y extendieron los resultados de otras investigaciones en las cuales se estudió la conducta autocontrolada de comer.

Palabras clave: ciclo T, presentación de comida, conducta de comer, autocontrol, palomas.mática.

ABSTRACT

Self-controlled eating behavior was studied in three food-deprived pigeons exposed to a procedure consisting on fifty 64-s time cycles (T cycles). In each cycle a food-hopper was always presented once for 3 s (S^R ₁ ) and could be presented for other 3 s (S^R ₂) after the T cycle elapsed, according to the following contingency. If the subject approached to S^R ₁ it was withdrawn and S^R ₂ delivery was cancelled; otherwise S^R ₂ was presented when the T cycle elapsed. In five experimental phases SR 1 was presented 3, 32, 16, 8, and 3 s before the end of the T cycle. Additionally, according to an ABA-design, a color change of a response key signaled (conditions A1 and A2) or not (condition B) S^R ₁ presentations and served as a distracting operandum. It was found that the number of S^R ₂ obtained was lower as S^R ₁ was presented closer to the beginning of each T cycle, regardless of signaling S^R ₁ presentations. It was also found that only in the A conditions of the first experimental phase (3 s) S^R ₁ interruptions were relatively low and R>0 of key pecks was comparatively high. Globally, these results replicated and extended those of previous studies in which self-controlled eating behavior was explored.

Keywords: T cycle, food presentation, eating behavior, self control, pigeons.

En una primera aproximación al estudio de la conducta autocontrolada, Cole, Coll y Schoenfeld (1982/1990) y Coll (1983) diseñaron un procedimiento para entrenar a palomas experimentalmente ingenuas y privadas de comida a alternar entre comer y no comer en presencia de comida. El procedimiento se puede describir como sigue: se programó un ciclo de tiempo repetitivo (ciclo T) conforme al cual se presentó el dispensador con alimento durante varios segundos una vez dentro de cada ciclo. Esta primera presentación del dispensador ocurrió independientemente de la conducta del sujeto y se denominó E^R₁. El dispensador se podía presentar de nuevo después de que terminaba el ciclo de tiempo (E^R₂) conforme a la siguiente contingencia. Aún cuando el sujeto podía consumir el E^R₁, si el sujeto se "abstenía" entonces se presentaba el E^R₂ y ahora sí podía consumir el alimento. Por el contrario, si el sujeto intentaba consumir el E^R₁ este último se retiraba y se cancelaba la presentación del E^R₂.

Tanto Coll como Cole, et al., sugirieron que alternar entre comer y no comer en presencia de comida era un ejemplo de la conducta autocontrolada que comúnmente se describe como "resistir" la tentación (e.g., Rachlin, 1974; Skinner, 1953). Así, en ambos estudios se averiguaron los efectos de una serie de variables sobre la adquisición y el mantenimiento de la conducta autocontrolada. Por ejemplo, Cole et al., expusieron a dos palomas privadas de alimento a un ciclo T constante en 63 s con presentaciones del E^R₁ en los últimos 3 s del ciclo y establecieron el criterio de obtener al menos el 80% de los reforzadores programados por sesión para afirmar que se había adquirido la conducta autocontrolada de comer. Encontraron que las dos palomas obtuvieron 6 y 26% de los E^R ₂ programados; esto es, los sujetos mostraron conducta impulsiva. Dados los resultados previos los autores expusieron a una tercera paloma al mismo procedimiento pero el ER 1 ocurrió 33 s antes del final del ciclo T y encontraron que el sujeto obtuvo 0% de los E^R₂ programados. A pesar de estos resultados negativos, la diferencia en el porcentaje de E^R₂ obtenidos entre los dos primeros sujetos y el tercero sugiere que la ubicación temporal del E^R₁ dentro del ciclo T puede ser una variable importante para adquirir la conducta de comer autocontrolada. Los autores sugirieron que, además de la ubicación temporal del E^R₁ dentro del ciclo T, podía ser necesaria una contingencia entre la emisión de una operante y la presentación del E^R₂ para establecer la conducta de comer autocontrolada.

En un estudio posterior, Coll (1983) empleó esencialmente el mismo procedimiento que Cole, et al., y averiguó la contribución de la contingencia respuesta-E^R₂ a la adquisición de la conducta autocontrolada en palomas. Específicamente, Coll entrenó a los sujetos a picar una tecla de respuesta para obtener comida como reforzador y posteriormente los expuso a ciclos T dentro de los cuales se presentó el E^R₁ independientemente de la conducta de los sujetos y si los sujetos se "se abstenían" de consumirlo entonces después de que terminaba el ciclo T podían picar la tecla para obtener el E^R₂. La autora manipuló la probabilidad de requerir el picotazo a la tecla después de que terminaba el ciclo T para entregar el E^R₂ y encontró que cuando esta última fue de 1.0 todos los sujetos adquirieron la conducta autocontrolada; se abstuvieron de consumir el E^R₁ en más del 80% de los ensayos. Por el contrario, cuando la probabilidad de requerir un picotazo a la tecla fue de 0.0, convirtiendo el procedimiento en uno de presentaciones del E^R₂ independientes de la conducta, el número de interrupciones del E^R₁ fue notablemente alto; la conducta autocontrolada de comer ocurrió infrecuentemente. Así, la autora concluyó que una contingencia respuesta- E^R₂ era necesaria para establecer y mantener la conducta de comer autocontrolada en palomas privadas de alimento.

Además de la contribución de la ubicación temporal del E^R₁ dentro del ciclo T y de la contingencia respuesta-E^R₂ a la adquisición de la conducta de comer autocontrolada, Cole et al., y Coll sugirieron que añadir la oportunidad de emitir una conducta incompatible con comer en presencia del E^R₁ podía facilitar la adquisición de la conducta autocontrolada. Por ejemplo, picar una tecla de respuesta iluminada que se presente al mismo tiempo que el E^R₁, podría ser una conducta distractora que facilite la adquisición y el mantenimiento de la conducta autocontrolada. Siguiendo este razonamiento, desde el punto de vista de los autores del presente estudio, es posible que la contingencia respuesta-E^R₂ más que ser necesaria para la adquisición de la conducta autocontrolada podría funcionar como una conducta distractora o incompatible con aproximarse al E^R₁.

De los estudios previamente descritos se deduce que es posible adquirir y mantener la conducta autocontrolada de comer en palomas privadas de comida. Sin embargo, los resultados de estos estudios fueron marginalmente consistentes intra y entre sujetos y pudieron ser consecuencia de combinaciones poco favorables de las variables involucradas en el procedimiento empleado. No obstante, por su naturaleza paramétrica, se puede examinar sistemáticamente la contribución de las variables involucradas en el procedimiento a la ocurrencia del fenómeno. Así, en el presente estudio se averiguaron los efectos de variar la ubicación temporal del E^R₁ dentro del ciclo T y de añadir una tecla en presencia del E^R₁ sobre la ocurrencia de la conducta de comer autocontrolada, en palomas privadas de alimento y expuestas a un procedimiento de reforzamiento independiente de la conducta.

MÉTODO

Sujetos

Sirvieron como sujetos tres palomas experimentalmente ingenuas y de cuatro años de edad al inicio de la investigación. Se mantuvo a los sujetos al 80% de su peso en alimentación libre y se alojaron en jaulas individuales con acceso libre a agua durante todo el experimento.

Aparatos

Se usaron tres cajas experimentales para palomas (Med Assoc. Mod. ENV-007) equipadas con un dispensador de comida (Med Assoc. Mod. ENV-205 M) y tres teclas de respuesta (Med Assoc. Mod. ENV-123 AM) cada una. Únicamente la tecla derecha fue operativa para registrar los picotazos y se podía iluminar con una luz roja o una luz verde, dependiendo de las condiciones experimentales. En las paredes del orificio a través del cual se presentaba el dispensador de comida se montó un fotoreceptor para registrar las veces que el sujeto metía la cabeza al dispensador para consumir grano mezclado. En la pared opuesta de la caja experimental se colocó un foco que proporcionó la iluminación general de la caja (Med Assoc. Mod. ENV-215 M). Cada caja experimental se colocó dentro de una caja a prueba de ruidos (Med Assoc. Mod. ENV-018 MD) con un ventilador que proveía ruido blanco. Las cajas estaban en un cuarto contiguo al laboratorio como una precaución extra para evitar ruidos externos. Las cajas experimentales se conectaron a través de una interface Med Assoc. a una computadora personal (Compaq). Se usó el lenguaje de programación Med-PC IV para presentar los eventos experimentales y registrar los datos correspondientes.

Procedimiento

Entrenamiento preliminar

En dos sesiones de una hora cada una, se entrenó a las palomas a comer del dispensador de comida con el siguiente procedimiento. Al principio de cada sesión se presentó el dispensador durante 12 s cada 60 s y después de que el sujeto se aproximaba al mismo y comía en cuatro ocasiones consecutivas, en las siguientes presentaciones se disminuía su duración en 1 s. Así, se acortó el tiempo que el dispensador estaba presente de 12 a 4 s y se mantuvo constante en esta duración hasta el final de la sesión.

Posteriormente, se entrenó a las palomas a picar la tecla derecha de la caja experimental usando un procedimiento de automoldeamiento (Brown & Jenkins, 1968, procedimiento 8). Específicamente, se programó un intervalo entre ensayos de 60 s señalado con la iluminación de la tecla derecha en rojo, seguido por un ensayo que consistió en un cambio de iluminación de la tecla de rojo a verde (estímulo) y la subsecuente entrega de comida durante 3 s. En dos bloques de 10 sesiones cada una, se estableció la duración del estímulo en 8 y después en 4 s y cada sesión terminó después de 50 ensayos.

Entrenamiento en autocontrol

Se expuso a los sujetos al siguiente procedimiento. Cada sesión experimental se dividió en 50 ciclos de tiempo repetitivo (ciclos T) de 64 s cada uno y el dispensador de comida se presentó durante 3 s una vez dentro de cada ciclo T (E^R₁). El dispensador de comida se podía presentar de nuevo después de que el ciclo T terminaba (E^R₂), de acuerdo a la siguiente contingencia. Si durante la presentación del E^R₁ el sujeto interrumpía el haz de luz del fotoreceptor éste último se retiraba y se cancelaba la entrega del E^R₂. Por el contrario, si el sujeto no interrumpía el haz de luz del fotoreceptor entonces se presentaba el E^R₂ cuando terminaba el ciclo T.

Manteniendo constante la contingencia previa, en una primera fase experimental el E^R₁ ocurrió en los últimos 3 s del ciclo T. En cuatro fases posteriores el E^R₁ se presentó 32, 16, 8 y 3 s antes del final del ciclo. En cada fase se programaron tres condiciones experimentales sucesivas en las cuales la iluminación de la tecla derecha cambió de rojo a verde durante 3 s (EN) concurrentemente con la presentación del E^R₁ (condiciones A1 y A2), o el color de la tecla se mantuvo constante en rojo durante todo el ciclo T (condición B). Cada condición experimental estuvo en efecto durante 20 sesiones.

RESULTADOS

En la Figura 1 se muestra el número de E^R₂ obtenidos en las sesiones consecutivas de exposición a cada fase experimental (columnas) y para cada sujeto (filas).

En la primera fase experimental, cuando el E^R₁ se presentó junto con el EN por primera vez en los últimos 3 s del ciclo T (Condición A1), se encontró que para los sujetos R1 y R2 el número de E^R₂ obtenidos varió entre 40 y 50, que era el máximo posible por sesión. Retirar el EN (Condición B) resultó en una disminución abrupta del número de interrupciones que aumentó gradualmente para el sujeto R1 y permaneció estable para el sujeto R2, conforme transcurrieron las sesiones de exposición a esta condición. Volver a presentar el EN (Condición A2) resultó de nuevo en un número de E^R₂ obtenidos cercano a 50 por sesión. Para el sujeto R3 el número de E^R₂ obtenidos por sesión varió entre 40 y 50 en las tres condiciones de esta primera fase experimental.

Presentar el E^R₁ 32 s antes del final del ciclo T resultó en un número de E^R₂ obtenidos que varió entre 10 y 0 para los sujetos R1 y R3 y en un rango que varió entre 30 y 10 interrupciones por sesión para el sujeto R2. En los tres sujetos los cambios de la variable dependiente ocurrieron independientemente de presentar o no el EN junto con el E^R₁.

En la tercera fase experimental y como en la fase anterior, independientemente de la presencia o ausencia del EN, presentar el E^R₁ 16 s antes del final del ciclo T resultó en un número de E^R₂ obtenidos muy variable sin una tendencia clara para los sujetos R1 y R3 y en un nivel similar al observado en la fase previa para el sujeto R2.

Presentar el E^R₁ 8 s antes del final del ciclo T resultó en un patrón de E^R₂ obtenidos similar al observado en la fase previa para los sujetos R1 y R3 y en un patrón similar a las de estos sujetos en el caso de R2.

Finalmente, el patrón de interrupciones que se observó en la primera exposición del E^R₁ en los últimos 3 s del ciclo T se reprodujo en la segunda exposición a esta fase experimental pero sólo para el sujeto R2; esto es, un número de E^R₂ obtenidos cercano al máximo posible de 50 por sesión, cercano a 0 y de nuevo cercano a 50 en las tres condiciones experimentales. En los sujetos R1 y R3 se observó un número similar de E^R₂ obtenidos a los de la fase experimental previa, independientemente de la presencia del EN.

En la Figura 2 se muestra el número de E^R₁ interrumpidos (rombos) y el número de presentaciones del EN en las que ocurrió al menos un picotazo (R>0, círculos vacíos) para las sesiones consecutivas de exposición a cada fase experimental (columnas) y para cada sujeto (filas).

Para cada fase experimental la primera y tercera columna muestran las variables dependientes para la presentación de ambos, el E^R₁ y el EN (condiciones A1 y A2 respectivamente). En las condiciones B se omitió la presentación del EN y por esta razón no se registraron picotazos durante el estímulo. Por claridad, en estas condiciones también se omitieron los datos del número de E^R₁ interrumpidos, pero se dejó el espacio correspondiente para mantener la secuencia de las condiciones del diseño del experimento.

Para la primera fase experimental en la que el E^R₁ se presentó 3 s antes de que el ciclo T terminara y fue acompañado por el EN (condiciones A), el número de E^R₁ interrumpidos varió entre 0 y 10 en la mayoría de las sesiones para los tres sujetos. Con respecto a R>0, sólo para el sujeto R2 la variable fue claramente más alta que el número de E^R₁. Para R1 y R2 se observó que R>0 fue un poco mayor que el número de E^R₁ en la mayoría de las sesiones. En la siguiente fase experimental, cuando el E^R₁ se presentó 32 s antes del fin del ciclo T, los tres sujetos interrumpieron casi todas las presentaciones del E^R₁ y casi en ninguna sesión picaron la tecla en presencia del EN. En las dos fases experimentales siguientes cuando el E^R₁ se presentó 16 y 8 s antes del final del ciclo T, el número de E^R₁ interrumpidos disminuyó gradualmente para los sujetos R1 y R2 o se mantuvo en un nivel comparativamente bajo y variable para el sujeto R3. Para estas mismas fases, R>0 permaneció en un nivel muy bajo para los tres sujetos. En la quinta fase experimental, cuando el E^R₁ se presentó de nuevo 3 s antes del final de ciclo T, el número de E^R₁interrumpidos fue relativamente variable y R>0 permaneció en cero o a un nivel bajo para los sujetos R1 y R3. Para el sujeto R2 el número de interrupciones al E^R₁ fue cercano a cero y R>0 fue comparativamente alto, igual que en la primera condición experimental.

DISCUSIÓN

En el presente experimento se averiguaron los efectos de variar la ubicación temporal de una recompensa (E^R₁) dentro de un ciclo T y los efectos de presentar o no un estímulo (EN) concurrentemente con la disponibilidad del E^R₁, ambos sobre el establecimiento y mantenimiento de la conducta de comer autocontrolada en palomas privadas de alimento; e.g., no comer en presencia de comida libremente disponible. Dado el diseño del experimento, para cada posición temporal del E^R₁ se probó el efecto de presentar o no el EN concurrentemente con el E^R₁. Por lo tanto, primero se discutirán los efectos de variar la ubicación temporal del E^R₁ y después la contribución de señalar o no las presentaciones del mismo sobre el número de E^R₂ obtenidos (Figura 1). Posteriormente, se comentarán en el mismo orden los efectos de las variables sobre el número de E^R₁ interrumpidos y el número de presentaciones del EN con al menos un picotazo (Figura 2).

Con respecto a la ubicación temporal del E^R₁ dentro del ciclo T (independientemente de la presencia o ausencia del EN junto con el E^R₁) se encontró que el número de E^R₂ obtenidos fue progresivamente mayor conforme el E^R₁ se presentó más cerca del final del ciclo T. Este hallazgo reprodujo y extendió los efectos de la misma variable que reportaron Cole, et al., quienes encontraron que para dos sujetos presentar el E^R₁ en los últimos 3 s de un ciclo T constante en 60 s resultó en un porcentaje de E^R₂ ganados de 6 y 26% y para un tercer sujeto presentar el E^R₁ a la mitad del ciclo T resultó en 0% de E^R₂ ganados. Este hallazgo sugirió un efecto decreciente de variar la ubicación temporal del E^R₁ dentro del ciclo T sobre la ocurrencia de la conducta autocontrolada; efecto que se confirmó en el presente experimento y se extendió a más valores de la variable independiente.

Variar la ubicación temporal del E^R₁ dentro de un ciclo T, es una manipulación comparable con la implementada en los procedimientos de estímulo intrusivo del condicionamiento operante y del condicionamiento Pavloviano. En estos procedimientos se añade un estímulo neutral a un patrón de conducta controlado por un programa de reforzamiento dado y se varía sistemáticamente su ubicación temporal entre reforzadores sucesivos. Se ha mostrado que un estímulo inicialmente neutral puede controlar confiablemente la ocurrencia antes, durante y después de su presentación, del picoteo a la tecla operante (Farmer & Schoenfeld, 1966), el picoteo a la tecla automoldeado (Bruner, 1981), el consumo de agua en presencia de una oportunidad para beber (Ávila & Bruner, 1994), la actividad general en ratas (Bruner, Gallardo & Ávila, 2002), etc. En estos procedimientos el estímulo se presenta independientemente de la conducta del sujeto y globalmente se ha encontrado que dependiendo de su ubicación temporal dentro del intervalo entre reforzadores el estímulo intrusivo controla diferentes porciones del patrón de conducta definido por el programa de reforzamiento. Estas porciones pueden consistir en tasas altas, medianas o bajas de la operante registrada. Por ejemplo, en el caso del picoteo a la tecla automoldeado, conforme se aleja el estímulo de la entrega del reforzador, los animales pican la tecla cada vez menos frecuentemente. En el procedimiento empleado en este estudio el E^R₁ sirvió como estímulo intrusivo y se explicitó una contingencia negativa entre aproximarse al E^R₁ y cancelar la presentación del E^R₂ al terminar el ciclo T. Así, el E^R₁ pudo funcionar como un estímulo negativo para la conducta de aproximarse al dispensador e intentar consumir la comida. Como se mostró en la sección de resultados, los sujetos se aproximaron más al dispensador conforme el E^R₁ se presentó cada vez más alejado del final del ciclo. Es posible que este resultado se debiera a que el E^R₁ perdió su control como estímulo negativo sobre la ocurrencia de la conducta consumatoria. Conforme a esta explicación se puede sugerir que la conducta autocontrolada definida como abstenerse de consumir una recompensa presente, hasta que se cumple algún criterio preestablecido se puede reducir al entrenamiento en discriminación entre consumir y no consumir comida libremente disponible en presencia de un estímulo.

Con respecto a la variable de señalar o no la presentación del E^R₁ se encontró lo siguiente. Los efectos de presentar el EN junto con el E^R₁ sobre el número de E^R₂ obtenidos por sesión fueron modulados por la ubicación temporal del E^R₁ dentro del ciclo T de la siguiente manera. En la primera fase experimental, para los sujetos R1 y R2 se encontró que cuando el E^R₁ se presentó en los últimos 3 s del ciclo T, señalar su presentación (Condiciones A1 y A2) resultó en un número de E^R₂ obtenidos cercano al máximo posible y notablemente más alto que el obtenido cuando no se señaló la presentación del E^R₁ (Condición B). Para el sujeto R3 la variable dependiente se mantuvo en un nivel por arriba del 80% independientemente de la presencia o ausencia del EN. Las disminuciones o los aumentos en el número de E^R₂ obtenidos que se observaron en las demás posiciones temporales del E^R₁ dentro del ciclo T, fueron independientes de presentar o no el EN junto con el E^R₁. Estos resultados sugieren que el EN perdió control sobre el responder en su presencia, igual que en cualquier otro procedimiento de estímulo intrusivo (e.g., Farmer & Schoenfeld, 1966), en función de alejarlo de la presentación del reforzador al final del ciclo T.

A continuación se discutirán los cambios en el número de E^R₁ interrumpidos y el número de presentaciones del EN con al menos una respuesta (R>0), en función de las mismas variables independientes que se describieron en la primera parte de esta sección. La importancia de estas variables dependientes es que pueden clarificar la contribución de agregar una tarea distractora en esta clase de procedimientos de autocontrol. La premisa principal de mantener una tecla iluminada es que los sujetos pueden emitir una actividad distractora en presencia del E^R₁; por ejemplo picar la tecla en lugar de aproximarse al E^R₁ y así ganar el máximo posible de E^R₂ al final del ciclo T. Así, en principio se debería facilitar la adquisición de la conducta autocontrolada de abstenerse de consumir la recompensa.

Cole, et al., y Coll sugirieron que en un procedimiento de autocontrol similar al usado en el presente estudio, la conducta de "esperar" podría significar que los sujetos estaban haciendo algo más mientras el reforzador estaba disponible pero no se podía consumir. Los autores no probaron directamente esta sugerencia, pero Grosch y Neuringer (1981) quienes emplearon el procedimiento de elección para estudiar autocontrol, reportaron datos que pueden ser pertinentes a este argumento. Los autores entrenaron a palomas a "elegir" entre una comida "preferida" y otra menos "preferida" y a "esperar" por la comida "preferida" en la presencia de ambos tipos de comida. Encontraron que añadir un operando distractor resultaba en un incremento notable del número de entregas de comida "preferida" en comparación con una condición en la que el operando "distractor" estaba ausente; esto es, los sujetos mostraron conducta autocontrolada.

Para todas las fases del presente experimento, en dos condiciones no sucesivas se señaló con un cambio de color en una tecla las presentaciones del E^R₁. Esta tecla iluminada o EN pudo funcionar como un operando "distractor" como en el experimento de Grosch y Neuringer. Así, en este estudio se comparó R>0 con el número de E^R₁ interrumpidos para todas las ubicaciones temporales del mismo dentro del ciclo T. Mientras que el número de E^R₁interrumpidos fue una función decreciente de variar su ubicación temporal del final al principio del ciclo T, R>0 fue cercano a cero cuando hubo un periodo de huella después de la presentación del E^R₁. Sin embargo, el número de E^R₁ interrumpidos y R>0 permanecieron en un nivel relativamente bajo y alto respectivamente, en la primera y quinta fase experimental en las que el E^R₁ se presentó en los últimos 3 s del ciclo T. De los datos de estas dos fases, se puede sugerir que mientras los sujetos estaban picando la tecla no estaban interrumpiendo el fotoreceptor. Estos resultados, replicaron y extendieron los resultados reportados por Grosch y Neuringer de un procedimiento de elección a un paradigma de conducta de comer autocontrolada. Aún más, se confirmó la sugerencia de Cole, et al., y de Coll de que establecer una conducta incompatible con la conducta de comer facilitaría la adquisición y el mantenimiento de la conducta de comer autocontrolada.

Una explicación de estos resultados es que, dado que picar la tecla resultó en un número bajo de E^R₁ interrumpidos y, en consecuencia, un número relativamente alto de E^R₂ obtenidos, estos últimos reforzaron supersticiosamente a los picotazos a la tecla (cf. Skinner, 1948). Un argumento en contra de esta explicación es que la variabilidad intra y entre sujetos en la frecuencia del picoteo a la tecla difícilmente confirma su mantenimiento por las contigüidades accidentales entre su ocurrencia y la entrega del E^R₂. Sin embargo, es posible que el E^R₂ reforzara supersticiosamente cualquier conducta diferente de interrumpir el E^R₁, incluyendo el picar la tecla. Esta interpretación es congruente con la reportada en estudios en los cuales la disponibilidad de una respuesta alternativa incrementó la probabilidad de reforzamiento en programas que requerían que el sujeto demorara su respuesta o se "abstuviera" de responder (e.g., Schwartz & Williams, 1971; Williams & Williams, 1969; Zuriff (1969). Por ejemplo, Williams y Williams (1969) expusieron a palomas privadas de alimento a un procedimiento de ensayo por ensayo en el que la iluminación intermitente de una tecla de respuesta fue seguida por comida, independientemente de la conducta del sujeto, pero el primer picotazo a la tecla apagaba la luz de la misma y cancelaba la entrega de la comida. Manteniendo esta contingencia vigente los autores, en su Experimento 3, añadieron una tecla "irrelevante" que los sujetos podían picar sin consecuencias programadas. Encontraron que los sujetos se "abstuvieron" de picar la tecla operativa más frecuentemente cuando estaba presente la tecla irrelevante que en su ausencia y sugirieron que el picoteo a la tecla "irrelevante" se pudo mantener por el reforzamiento adventicio del mismo. Schwartz y Williams expusieron a palomas a un procedimiento de ensayo discreto en el cual se reforzaron sólo los picotazos a una tecla operativa espaciados por al menos 6 s. Encontraron que después de 45 sesiones de 50 ensayos cada uno los sujetos cumplieron el requisito en 10% o menos de los ensayos. Posteriormente, los autores añadieron una tecla alternativa y operativa para registrar picotazos pero sin consecuencias programadas y encontraron que los sujetos cumplieron el criterio en 75% o más de los ensayos. Los autores sugirieron que los sujetos podían "abstenerse" exitosamente de responder en este tipo de procedimientos de reforzamiento del responder espaciado sólo cuando otro estímulo correlacionado con el reforzador está disponible para responder en él. Así, se enfatizó la importancia de una conducta colateral para mediar la ejecución espaciada de los sujetos. Aún cuando los autores no explicaron directamente la adquisición y el mantenimiento de la conducta colateral de picar una tecla sin consecuencias programadas, es viable sugerir que, igual que en el estudio de Williams y Williams, el responder colateral se mantuvo por su relación supersticiosa con la entrega del reforzador después de cumplir la contingencia especificada en la tecla operativa. En breve, en el procedimiento de automantenimiento negativo y en el procedimiento de reforzamiento del responder espaciado, se mostró que una conducta colateral era necesaria para cumplir una contingencia entre una operante y la entrega del reforzador. En el presente estudio se demostró la necesidad de explicitar conducta colateral para cumplir un requisito de "abstenerse" de emitir la conducta consumatoria de consumo de comida, como un caso de conducta autocontrolada.

Un argumento final respecto del papel de la tecla distractora en el presente estudio es que posiblemente sólo facilitó la adquisición de la conducta autocontrolada en la primera fase experimental, cuando el E^R₁ ocurrió en los últimos 3 s del ciclo T. Sin embargo, alargar el intervalo entre la presentación del E^R₁ y el E^R₂ diluyó el efecto de añadir la tecla distractora sobre las variables dependientes registradas en el estudio. Así, la proximidad temporal entre el E^R₁ y el E^R₂ es la variable que explica el mantenimiento de un número relativamente alto de E^R₂ obtenidos; que se acerca al criterio establecido por Cole et al., y Coll de 80% de los reforzadores obtenidos para afirmar que ocurrió la conducta autocontrolada de "abstenerse" de consumir comida disponible. Siguiendo este argumento, los resultados de este experimento también se podrían explicar en términos de un gradiente de demora del reforzamiento, igual que cualquier otra conducta operante cuya frecuencia disminuye conforme se alarga el intervalo entre su ocurrencia y la entrega del reforzador que la mantiene (cf. Skinner, 1938; Renner, 1964; Tarpy & Sawabini, 1974).

Además de las comparaciones previamente mencionadas, otra contribución de este estudio se refiere a que se clarificó el papel de la contingencia operante respuesta–reforzador en la adquisición y mantenimiento de la conducta autocontrolada. Con respecto a esta contingencia Coll (1983) expuso a palomas a un procedimiento similar al usado por Cole et al., y averiguó los efectos de variar la probabilidad de requerir un picotazo a una tecla de respuesta para entregar el E^R₂ y la probabilidad de presentar el E^R₂ después de que ocurrió la respuesta. La autora encontró que cuando estas probabilidades se establecieron en 1.0, todos los sujetos obtuvieron casi el 100% de los E^R₂ programados; esto es, los sujetos mostraron conducta de comer autocontrolada. Disminuir la probabilidad de requerir la operante o de presentar el E^R₂ resultó en un porcentaje progresivamente menor de E^R₂ obtenidos. La autora explicó estos resultados en términos de que es necesario reforzar la conducta de "abstenerse" de consumir el E^R₁ con la presentación del E^R₂ y la necesidad de explicitar una operante para producir la presentación del E^R₂ durante la adquisición de la respuesta autocontrolada. En las condiciones con EN ausente de la primera y última fase experimental del presente estudio se reprodujeron las condiciones en las cuales la probabilidad de requerir un picotazo a la tecla para entregar el E^R₂ se estableció en 0.0 y la probabilidad de presentar el E^R₂ se estableció en 1.0 del estudio de Coll. Se encontró que el número de E^R₂ obtenidos permaneció más o menos en el mismo nivel en las dos exposiciones a las condiciones mencionadas previamente. Estos resultados replicaron los reportados por Coll y se extendió el procedimiento de autocontrol de uno en el que era necesaria una contingencia respuesta-reforzador para adquirir la conducta de comer autocontrolada a un procedimiento en el cual todos los eventos experimentales ocurrieron independientemente de la conducta del sujeto de picotear la tecla.

Rachlin (1974) describió el procedimiento empleado en el presente estudio como autocontrol de "fuerza bruta" o simplemente rechazar una tentación presente y sugirió que "la causa directa de tal conducta es la correlación a largo plazo entre la conducta y sus consecuencias" (p. 100) y no el resultado de contingencias específicas entre ocurrencias aisladas de ejemplos de conducta y de consecuencias. Conforme a esta sugerencia los resultados de este experimento, al menos con respecto al número de E^R₁ interrumpidos, se pueden explicar en términos de la tasa de E^R₂ obtenidos; una tasa de E^R₂ obtenidos relativamente alta debería correlacionar con un número relativamente bajo de E^R₁interrumpidos. Sin embargo, dado que en el presente experimento se estableció una contingencia entre no interrumpir la presentación del E^R₁ y obtener el E^R₂, la explicación previa resulta circular y de poca utilidad para entender la conducta autocontrolada de "abstenerse" de consumir una recompensa hasta que se cumple un criterio externo.

Independientemente de la viabilidad de la explicación previa de los datos de este experimento, es interesante notar que Rachlin sugirió que el autocontrol de "fuerza bruta" es un caso especial del paradigma general de autocontrol conceptualizado como la elección entre pares de recompensas que varían en magnitud y demora de entrega. Conforme a este último paradigma la conducta autocontrolada se conceptualiza como emitir una respuesta que resulta en una recompensa grande pero demorada en lugar de emitir una respuesta diferente que resulta en un reforzador pequeño pero inmediato (cf. Rachlin, 2000; para una descripción reciente sobre autocontrol). En este caso la ocurrencia de la conducta consumatoria una vez que se obtiene la recompensa se asume como garantizada. Para los autores del presente estudio, los dos paradigmas son complementarios en el sentido que destacan diferentes aspectos de la clase de interacciones conducta -ambiente que se denomina autocontrol. En particular el paradigma de elección destaca la emisión de conducta operante que procura recompensas de diferente magnitud o demora de entrega. En comparación el paradigma de autocontrol empleado en este estudio enfatiza la conducta consumatoria que emite el sujeto para consumir la recompensa obtenida. Aún más, en ambos paradigmas el sujeto tiene que esperar para consumir la recompensa pero hay una diferencia básica entre los dos en las condiciones que prevalecen durante el periodo de espera. En el caso de elección el sujeto espera en la ausencia del reforzador y en el paradigma de autocontrol el sujeto espera en la presencia de la recompensa. Como Rachlin afirmó, en los dos paradigmas está involucrado el aspecto temporal de la relación entre la conducta operante o la consumatoria y la entrega de las recompensas. Conforme a este punto de vista, el paradigma de autocontrol que sugirió Schoenfeld y sus colaboradores, y se empleó en el presente estudio, y el paradigma de autocontrol como un caso de elección tal como lo presentó Rachlin son complementarios en términos de los aspectos de la conducta autocontrolada, operante o consumatoria, que cada uno destaca y en términos del énfasis de cada uno en las variables temporales involucradas en el fenómeno del autocontrol.

Sobre el efecto de variar la ubicación del E^R₁ dentro del ciclo T, es posible conceptualizar el procedimiento de elección en el que hay una demora entre cumplir un requisito, emitir una conducta, y la entrega del reforzador como un procedimiento análogo al empleado en el presente estudio por la siguiente razón. En el presente experimento se manipularon cuatro ubicaciones temporales del E^R₁ que podrían ser conceptualizadas como la demora entre cumplir, al igual que en el procedimiento de elección, el requisito de esperar en presencia de comida, y la entrega del reforzador. Se encontró, al igual que en otros procedimientos de autocontrol, que aumentar la demora incrementó la conducta impulsiva, en este caso el número de interrupciones al E^R₁; en cambio disminuir la demora resultó en un decremento del número de interrupciones al E^R₁ y, por lo tanto, en un mayor número de reforzadores ganados.

Estos dos paradigmas de autocontrol pueden extenderse a situaciones en las cuales durante el periodo de "espera", en presencia o ausencia del reforzador, el sujeto tiene que completar un requisito de un número de respuestas para tener acceso al reforzador. Por ejemplo, Mahoney y Bandura (1972) entrenaron a palomas privadas de alimento a picar una tecla repetidamente en presencia de comida para tener acceso a esta. Si las palomas intentaban consumir la comida sin cumplir el requisito, esta se retiraba, el sujeto ya no podía consumirla y empezaba un nuevo ensayo. En fases experimentales posteriores los autores probaron el efecto de retirar la contingencia entre picar la tecla y obtener acceso al reforzador sobre el número de veces que las palomas picaban a la tecla antes de intentar consumir la comida. En general, encontraron que era posible entrenar a las palomas a cumplir requisitos pequeños o grandes para poder obtener acceso a la comida. Sin embargo, quitar la contingencia resultó en una disminución abrupta del número de veces que las palomas picaron a la tecla antes de intentar consumir la comida. Los autores interpretaron este resultado en términos del concepto de auto reforzamiento el cual se refiere simplemente al hecho de que los animales cumple un requisito de respuestas antes de accesar al reforzador en presencia del mismo.

Mahoney y Bandura, entrenaron a palomas a cumplir un requisito de respuestas antes de consumir la recompensa. Sin embargo, cuando quitaron la contingencia el número de picotazos antes de consumir la recompensa que ya está disponible, disminuyó rápidamente hasta que los animales consumieron la comida sin emitir ninguna respuesta. En términos estrictos, el presente experimento no es uno de autoreforzamiento pero es posible hacer algunas comparaciones. Durante la primera y quinta fase experimental, que son comprables con el procedimiento de Mahoney y Bandura, los autores de este estudio lograron establecer la conducta de esperar en presencia de una recompensa sin establecer una contingencia respuesta-reforzador. También se observó que al menos dos de tres sujetos mantuvieron la conducta de picar a la tecla durante la presentación del E^R₁. Los resultados de este experimento son similares a los de Mahoney y Bandura dado que las palomas picaron a la tecla por lo menos una vez antes de intentar comer y mantuvieron constante este patrón. Por otro lado, aún cuando en algunas ocasiones las palomas picaron la tecla con una frecuencia baja o nula, se abstuvieron de interrumpir el E^R₁. Este resultado se podría caracterizar como una extensión de la conducta de autoreforzamiento en el sentido de que las palomas pudieron "autoreforzarse" al emitir otra clase de conducta antes de intentar comer. Sin embargo, desde el punto de vista de los autores del presente estudio es más importante notar las contigüidades cuantitativas entre el procedimiento del estudio de Mahoney y Bandura y el del presente estudio (cf. Sidman, 1969). Conforme a estas contigüidades se podrían sistematizar todos los ejemplos de conducta que ocurren en presencia de una recompensa antes de consumir esta última, identificados actualmente como autocontrol, conducta colateral, "autoreforzamiento", etc.

Referencias

Ávila, R., & Bruner, C. A. (1994). Varying the temporal placement of a drinking opportunity in a fixed interval schedule. Journal of the Experimental Analysis of Behavior, 62, 307314. [ Links ]

Brown, P. L., & Jenkins, H. M. (1968). Auto-shaping of the pigeon's key-peck. Journal of the Experimental Analysis of Behavior, 11, 1-8. [ Links ]

Bruner, C. A. (1981). The effect of cycle length, interstimulus interval and probability of reinforcement in autoshapingautomaintenance. Revista Mexicana de Análisis de la Conducta, 7, 149157. [ Links ]

Bruner, C. A., Gallardo, L. M., & Ávila, R. (2002). Variaciones en la ubicación temporal de una señal dentro de un ciclo de reforzamiento independiente de la respuesta sobre la actividad de las ratas. Revista Mexicana de Análisis de la Conducta, 28, 3-18. [ Links ]

Cole, B. K., Coll, G., & Schoenfeld, W. N. (1982/1990). Análisis experimental del autocontrol. Trabajo presentado en el primer Simposio Bienal sobre la Ciencia de la Conducta, Febrero 12-14 1982, ENEP Iztacala, UNAM. Publicado en: Ribes, E., & Harzem, P. (Eds.), Lenguaje y conducta (169-192). México: Trillas. [ Links ]

Coll, G. (1983). Investigation of two parameters that establish self-control eating in the pigeon. Unpublished doctoral dissertation, City University of New York, New York.

Farmer, J., & Schoenfeld, W. N. (1966). Varying temporal placement of an added stimulus in a fixed-interval schedule. Journal of the Experimental Analysis of Behavior, 9, 369-375. [ Links ]

Mahoney, M. & Bandura, A. (1972). Self-reinforcement in pigeons. Learning and motivation,3, 293-303. [ Links ]

Grosch, J., & Neuringer, A. (1981). Self-control in pigeons under the Mischel paradigm. Journal of the Experimental Analysis of Behavior, 35, 3-21. [ Links ]

Rachlin, H. (1974). Self-control. Behaviorism, 2, 94-107. [ Links ]

Rachlin, H. (2000). The Science of Self-Control. Cambridge, MA: Harvard University Press. [ Links ]

Renner, K. E. (1964). Delay of reinforcement: a historical review. Psychological Bulletin, 61, 341-361. [ Links ]

Schwartz, B., & Williams, D. R. (1971). Discrete-trial spaced responding in the pigeon: the dependence of efficient performance on the availability of a stimulus for collateral pecking. Journal of the Experimental Analysis of Behavior, 16, 155-160. [ Links ]

Sidman, M. (1960). Tactics of scientific research. New York Appleton Century Crofts. [ Links ]

Skinner, B. F. (1938). The behavior of the organisms. New York: Appleton-Century Croft. [ Links ]

Skinner, B.F. (1948). Superstition in the pigeon. Journal of Experimental Psychology, 38, 168-172. [ Links ]

Skinner, B. F. (1953). Science and human behavior. New York: Appleton-Century Croft. [ Links ]

Tarpy, R. M., & Sawabini, F. L. (1974). Reinforcement delay: a selective review of the last decade. Psychological Bulletin, 81, 984-997. [ Links ]

Williams, D. R., & Williams, H. (1969). Auto-maintenance in the pigeon: sustained pecking despite contingent non-reinforcement. Journal of the Experimental Analysis of Behavior, 12, 511-520. [ Links ]

Zuriff, G.E. (1969). Collateral responding during differential reinforcement of low rates. Journal of the Experimental Analysis of Behavior, 12, 971-976. [ Links ]

Received: April 01, 2010;
accepted: June 30, 2011

¹⁾ Este manuscrito es una versión corta de la tesis de Licenciatura que el primer autor presentó en la Facultad de Psicología de la UNAM y el segundo autor fue el director de tesis. El experimento se condujo con el apoyo de los proyectos PAPIIT IN 303007 e IN303909. El primer autor recibió beca de terminación de estudios y de elaboración de tesis de estos proyectos, respectivamente. Los autores agradecen a Hilda Palacios y a Sandra Avilés su ayuda en la conducción del experimento. Los autores pueden ser contactos en Laboratorio de Análisis Experimental de la Conducta, Edificio C, 2do. Piso, Cubículo 6. Facultad de Psicología, Universidad Nacional Autónoma de México. Av. Universidad 3004, México, D.F. 04510. Correo electrónico: jc_gonzalez16@ yahoo.com.ar ó raulas@servidor.unam.mx