Efectos del reforzamiento cualitativamente variado sobre la tasa de respuesta en ratas

Roca, Alicia; Milo, Jessie-Sue; Lattal, Kennon A.

Permalink

Acta Comportamentalia

ISSN 0188-8145

Acta comport. vol.19 no.1 Guadalajara 2011

Efectos del reforzamiento cualitativamente variado sobre la tasa de respuesta en ratas

Effects of qualitatively varied reinforcement on response rate in rats

Alicia Roca; Jessie-Sue Milo; Kennon A. Lattal¹

West Virginia University

RESUMEN

Se compararon los efectos del reforzamiento cualitativamente variado y del reforzamiento constante sobre la tasa de respuesta en una palanca empleando a ratas como sujetos. En el Experimento 1, se expuso a ratas a un programa múltiple de tres componentes durante los cuales se reforzaron las presiones a una palanca conforme a un programa de intervalo variable 60 s. Durante dos componentes de reforzamiento constante, se entregó leche o comida. Durante el componente de reforzamiento variado, se entregó la leche o la comida de manera aleatoria. En el Experimento 2, se condujeron tres tipos de sesiones, durante las cuales estuvo en efecto un programa de intervalo variable 60 s. Durante el primer tipo de sesión, se entregó la leche, durante el segundo tipo se entregó la comida y durante el tercer tipo se entregó la leche y la comida. El orden de las sesiones se eligió al azar diariamente. En ambos experimentos, la tasa de respuesta fue mayor cuando se entregó sólo la leche que cuando se entregaron los reforzadores variados. Se concluyó que las variaciones cualitativas del reforzador no necesariamente resultan en aumentos en la tasa de respuesta relativas al reforzamiento constante. El efecto aditivo del reforzamiento variado sobre la tasa de respuesta depende de manipulaciones experimentales específicas.

Palabras clave: reforzadores cualitativamente variados, tasa de respuesta, programas múltiples, programas de intervalo variable, ratas

ABSTRACT

This study compared the effects of constant versus qualitatively varied reinforcers on rate of lever pressing using rats as subjects. In Experiment 1, rats were exposed to a 3-component multiple schedule, in which responses were maintained by variable-interval 60-s schedules of reinforcement. During two constantreinforcer components, either sweetened condensed milk or pellets were delivered. In the varied reinforcer component, milk or pellets were delivered in irregular order. In Experiment 2, lever presses were maintained by a variable-interval 60-s schedule during three session types. In one session type, pellets were delivered. In a second session type, milk was delivered and in the third session type milk or pellets were delivered in irregular order. The type of session was randomly selected at the beginning of each day. In both experiments, response rates maintained by milk were generally higher than response rates maintained by varied reinforcers. Qualitatively different reinforcers do not necessarily maintain higher response rates than those maintained by constant reinforcers. The summative effect of qualitatively different reinforcers on response rates depends on specifi c experimental arrangements.

Keywords: Qualitatively varied reinforers, response rates, multiple schedules, variable interval schedules, rats

En el análisis conductual aplicado, la identifi cación de estrategias que garanticen la efectividad de los reforzadores para el mantenimiento de la conducta es crucial para desarrollar intervenciones conductuales exitosas. Algunos autores afi rmaron que una estrategia que facilita el mantenimiento de la conducta es variar la calidad del reforzador de ocasión en ocasión (e. g., Cooper, Heron & Heward, 2000). Esta afi rmación se basa en algunas demostraciones de que la entrega de reforzadores cualitativamente diferentes de ocasión en ocasión resulta en una mayor tasa de respuesta relativa a la tasa de respuesta que se obtiene al entregar un solo tipo de reforzador consistentemente (en adelante, reforzamiento constante). Por ejemplo, Egel (1980) probó la efectividad del reforzamiento variado para el mantenimiento de la respuesta de presión a la palanca empleando a niños como sujetos. Egel usó tres tipos de comida específi cos para cada niño, como chocolates, uvas y helado como reforzadores. Durante una condición de reforzamiento constante, Egel entregó sólo uno de los tres reforzadores elegidos para cada niño cada vez que los participantes presionaban la palanca. Posteriormente, el autor implementó una condición de reforzamiento variado, durante la cual reforzó las presiones a la palanca entregando uno de los dos tipos de comida restantes. El orden de presentación de los reforzadores fue al azar. Egel encontró que las presiones a la palanca se mantuvieron por un mayor período de tiempo durante la condición de reforzamiento variado que durante la condición en la que entregó un solo reforzador constantemente.

En una aplicación de su estudio básico sobre reforzamiento cualitativamente variado, Egel (1981) determinó los efectos diferenciales del reforzamiento variado y del reforzamiento constante sobre la conducta de niños diagnosticados con autismo. A diferencia del experimento anterior (Egel, 1980), en el cual la variable dependiente principal fue la tasa de respuesta, el autor estudió los efectos del reforzamiento variado sobre el porcentaje de respuestas correctas en tareas de discriminación y sobre el tiempo que los niños permanecían haciendo las tareas. En general, Egel mostró que tanto el porcentaje de respuestas correctas como los intervalos de tiempo que los niños permanecían haciendo las tareas fueron mayores durante la condición de reforzamiento variado que durante la condición en la cual entregó un sólo reforzador.

En otro estudio sobre reforzamiento variado, Milo, Mace y Nevin (2010) emplearon un programa múltiple de reforzamiento para comparar los efectos del reforzamiento variado y del reforzamiento constante sobre la tasa de respuesta empleando a niños diagnosticados con autismo como participantes. Antes de exponer a los participantes al programa múltiple, Milo et al. hicieron una prueba para determinar los tres reforzadores preferidos de los cuatro participantes. Los reforzadores eran algunos tipos de comida y de bebidas que los autores ordenaron del más preferido al menos preferido (1, 2 y 3). El programa múltiple consistía de dos componentes de dos minutos cada uno. En ambos componentes reforzaron las presiones a un botón conforme a un programa de razón fi ja (RF) 10. En el componente de reforzamiento constante, entregaron sólo uno de los tres reforzadores (1, 2 ó 3) en condiciones sucesivas. Durante el componente de reforzamiento variado entregaron los tres reforzadores (1, 2 y 3) de manera aleatoria. Milo et al. encontraron que independientemente del reforzador empleado durante el componente de reforzamiento constante (i. e., independientemente de que el reforzador fuera el más preferido o el menos preferido), la tasa de respuesta al botón fue mayor durante el componente de reforzamiento variado que durante el componente de reforzamiento constante. Adicionalmente, Milo et al. determinaron el número de veces que los participantes elegían responder en un botón que resultaba en reforzamiento variado (reforzadores 1, 2 y 3) o bien responder en un segundo botón que resultaba en reforzamiento constante (1, 2 ó 3) empleando un programa concurrente RF1 RF1. Los cuatro participantes consistentemente eligieron la opción que resultaba en reforzamiento variado.

Las investigaciones de Egel (1980; 1981) y de Milo et al. (2010) constituyen evidencia de que el reforzamiento cualitativamente variado facilita el mantenimiento de la conducta. Adicionalmente, Milo et al. mostraron que en una situación de elección, los participantes respondían más en la opción que resultaba en reforzamiento variado que en la opción que resultaba en la entrega de un solo reforzador. No obstante, existen estudios en los cuales se reportó que las variaciones en la calidad del reforzador no necesariamente resultaron en un mayor número de respuestas en comparación con el número de respuestas obtenidas al entregar un reforzador constante. Por ejemplo, Bowman, Piazza, Fisher, Hagopian y Kogan (1997) condujeron una prueba para determinar la preferencia de los participantes por diferentes estímulos, como algunos tipos de comida e incluso estímulos sociales, como recibir elogios del investigador. Los participantes eran siete niños diagnosticados con retraso en el desarrollo. Posteriormente, expusieron a los participantes a un programa concurrente RF1 RF1, en el que una respuesta resultaba en la entrega de un reforzador constante y una respuesta en la segunda opción resultaba en reforzamiento variado. El reforzador constante era el estímulo que cada participante había elegido en primer lugar en la prueba de preferencia. Los reforzadores variados consistían en la entrega de los estímulos que los participantes preferían en segundo, tercer y cuarto lugar. La respuesta criterio fue diferente entre los participantes (e. g., sentarse en una silla, presionar un interruptor o llenar un sobre). Bowman et al. encontraron que sólo cuatro de los siete participantes emitían consistentemente la respuesta que resultaba en reforzamiento variado, dos de los participantes típicamente respondían en la opción que resultaba en la entrega de un reforzador constante y para uno de los participantes las respuestas se distribuyeron de manera similar en ambas opciones.

Además del estudio de Bowman et al. (1997) existen al menos otras dos investigaciones en las cuales se reportó que las variaciones en la calidad del reforzador no resultaron en un mayor número de respuestas relativo a la entrega de un reforzador constante (e. g., Koehler, Iwata, Roscoe, Rolider , & O'Steen, 2005; North & Iwata, 2005). Por ejemplo, Koehler et al. expusieron a cuatro participantes diagnosticados con retraso del desarrollo a un programa concurrente RF1 RF1, en el cual una respuesta resultaba en la entrega de un reforzador previamente establecido como favorito en una prueba de preferencia (1), mientras que la respuesta en una segunda opción resultaba en la entrega de tres reforzadores catalogados como los menos preferidos de una lista de 16 reforzadores posibles (14, 15 y 16). Koehler et al. reportaron que todos los sujetos eligieron la opción del reforzamiento constante, en el que recibían únicamente el reforzador establecido como favorito. En una segunda condición, Koehler et al. sustituyeron los reforzadores disponibles en la opción de reforzamiento variado por los reforzadores que cada sujeto había elegido inmediatamente después del reforzador favorito durante la prueba de preferencia (2, 3 y 4) y en la opción de reforzamiento constante continuaron entregando sólo el reforzador favorito (1). Los autores reportaron que la mitad de los participantes respondían en las dos opciones, mientras que para la otra mitad las respuestas ocurrieron principalmente en el componente de reforzamiento variado.

En un segundo experimento, Koehler et al. (2005) también obtuvieron hallazgos mixtos al comparar los efectos del reforzamiento variado y del reforzamiento constante durante una condición en la que entregaban los reforzadores conforme a un programa de RF1. En dos condiciones sucesivas del experimento, entregaron un reforzador catalogado como no preferido y subsecuentemente, en la condición de reforzamiento variado entregaron tres reforzadores no preferidos alternadamente. Dos de los participantes respondieron infrecuentemente en ambas condiciones, mientras que para un participante el número de respuestas fue ligeramente mayor en la condición de reforzamiento variado que en la condición de reforzamiento constante. Posteriormente, los autores añadieron un reforzador catalogado como favorito en la condición de reforzamiento variado (i. e., alternaron tres reforzadores no preferidos y el reforzador favorito) y compararon la tasa de respuesta con una condición de reforzamiento constante en la que entregaron únicamente el reforzador catalogado como favorito. No encontraron efectos sistemáticos entre ambas condiciones. Los resultados de Koehler et al. sugieren que variar la calidad del reforzador per se no tiene efectos aditivos en la tasa de respuesta relativo a una condición de reforzamiento constante, sino que depende del tipo de reforzadores empleados en términos de la preferencia de los participantes. No obstante, es necesario aclarar que los reforzadores "menos favoritos" en el segundo experimento de Koehler et al. fueron elegidos debido a que los participantes no hicieron contacto con ellos durante la prueba de preferencia previa al experimento. Por lo tanto, es posible argumentar que los estímulos "menos preferidos" funcionalmente no servían como reforzadores, por lo que es necesario tomar los hallazgos con cautela.

Existen diferencias ostensibles entre los procedimientos de los estudios aplicados sobre reforzamiento variado, por ejemplo, el tipo de programa de reforzamiento empleado, las características de los participantes, el tipo de reforzadores que usaron y las respuestas seleccionadas. Las diferencias en los procedimientos y la historia de reforzamiento de los participantes en términos de los tratamientos específi cos a los que habían estado expuestos impiden establecer si el reforzamiento variado es más efi ciente que el reforzamiento constante para mantener la conducta. Dichas diferencias entre los estudios aplicados también impiden determinar cuáles son las variables responsables de que el reforzamiento constante en ocasiones mantenga una tasa de respuesta mayor que el reforzamiento variado. Una solución a este problema es analizar los efectos del reforzamiento variado sobre el mantenimiento de la conducta en condiciones controladas de laboratorio.

En el análisis experimental de la conducta, el término de reforzamiento variado se empleó para las situaciones experimentales en las cuales se cambiaba alguna dimensión del reforzador de ensayo en ensayo, bajo cualquier programa de reforzamiento establecido por el investigador (Logan, 1960; Kimble, 1961). Los primeros estudios sobre reforzamiento variado se enfocaron en variar algunas dimensiones del reforzador de ensayo en ensayo, como la magnitud (Beier, 1958) y la demora de reforzamiento (Logan, Beier & Kincaid, 1956). Existen pocos estudios en los que se varió la calidad del reforzador. Wunderlich (1960) realizó uno de los primeros estudios sobre reforzamiento cualitativamente variado, empleando un procedimiento de ensayo discreto. Para tres grupos de ratas, Wunderlich entregó sólo comida, sólo agua o alternó la entrega de agua y de comida de ensayo en ensayo (reforzamiento variado) una vez que las ratas llegaban a una caja meta después de correr por un pasadizo. Wunderlich reportó que la velocidad de carrera fue mayor para el grupo de ratas a las que les entregó el reforzamiento variado. Además de la variable dependiente peculiar, una limitación del estudio de Wunderlich es que la comida y el agua aumentan mutuamente su valor reforzante. En términos de la economía conductual, el agua y la comida son reforzadores complementarios, ya que la disponibilidad del agua aumenta el valor reforzante de la comida y complementariamente, la presencia de la comida aumenta las propiedades reforzantes del agua (Roca & Bruner, 2007). Por lo tanto, es incierto que los resultados de Wunderlich se debieron al efecto del reforzamiento variado o bien a la relación de complementariedad de los reforzadores empleados.

Hasta donde los autores saben, los estudios de Steinman (1968a; 1968b) son los únicos que incluyen experimentos en los cuales se empleó un procedimiento de operante libre para comparar directamente los efectos del reforzamiento cualitativamente variado y del reforzamiento constante sobre el mantenimiento de la conducta en ratas. Steinman (1968a) expuso a ratas a un programa de reforzamiento de intervalo variable (IV) 45 s conforme al cual las presiones a una palanca resultaban en la entrega de pellets. Una vez que observó estabilidad en la tasa de respuesta, en una segunda condición, Steinman expuso a las ratas a un programa múltiple de dos componentes. En un componente del programa múltiple, siguió entregando pellets conforme al programa de IV 45 s, mientras que en el segundo componente entregó una solución de sucrosa y agua al 30%. En la tercera condición del experimento, Steinman añadió un tercer componente al programa múltiple, durante el cual una vez que se cumplía el requisito de respuesta del IV 45 s, entregó la solución de sucrosa o pellets alternadamente (i. e., reforzamiento variado). Los tres componentes tenían una duración de cinco minutos y estaban señalados por tres tonos de diferentes frecuencias. Steinman encontró que la tasa de respuesta durante el componente en el que entregó la solución de sucrosa fue mayor que durante el componente en el que entregó pellets. No obstante, la tasa de respuesta durante el componente de reforzamiento variado fue considerablemente mayor que durante los dos componentes en los que usó un reforzador constante. En una replicación sistemática de este experimento, Steinman (1968b) igualó la tasa de respuesta durante el componente en el que entregó sólo pellets y durante el componente en el que entregó sólo la solución de sucrosa diluyendo la solución de sucrosa antes de introducir el componente de reforzamiento variado. Aún bajo estas condiciones, la tasa de respuesta durante el componente de reforzamiento variado fue mayor que la tasa de respuesta durante los dos componentes en los que entregó un reforzador constante.

Los estudios de Steinman (1968a; 1968b) se añaden a la evidencia de que el reforzamiento cualitativamente variado de ocasión en ocasión conduce a una mayor tasa de respuesta que el reforzamiento constante. La virtud del procedimiento general de los estudios de Steinman es que durante las últimas condiciones de ambos experimentos, el programa múltiple de tres componentes permitió comparar dentro de una misma sesión los efectos de presentar los reforzadores variados y de presentar cada reforzador por separado sobre la tasa de respuesta en una palanca. Sin embargo, una primera pregunta que surge es si el hecho de que las ratas hubieran estado expuestas por un tiempo relativamente prolongado al reforzamiento constante con pellets y posteriormente al reforzamiento constante con la solución de sucrosa antes de introducir el componente de reforzamiento variado determinó los resultados que obtuvo Steinman. La segunda pregunta que surge es si sería posible replicar el hallazgo de que el reforzamiento variado resulta en tasas altas de respuesta relativo al reforzamiento constante cuando los reforzadores variados y los reforzadores constantes se presentan a través de diferentes sesiones, y no durante una misma sesión. El antecedente de esta manipulación es el experimento de Egel (1980) en el que usó a niños como sujetos, y entregó reforzadores constantes y variados durante sesiones experimentales sucesivas. Los dos experimentos reportados en el presente estudio se realizaron para intentar contestar ambas preguntas. El propósito general del trabajo fue comparar los efectos del reforzamiento cualitativamente variado y del reforzamiento constante sobre la tasa de respuesta usando ratas como sujetos.

EXPERIMENTO 1

El propósito del Experimento 1 fue comparar los efectos del reforzamiento constante y del reforzamiento variado sobre la tasa de respuesta conforme a programas múltiples de reforzamiento, empleando a ratas como sujetos. Se expuso a ratas a un programa múltiple de dos componentes de reforzamiento constante y una vez que se estabilizaron las tasas de respuesta se introdujo un componente de reforzamiento variado. Para otras ratas, se expuso directamente a los sujetos al programa múltiple de tres componentes, de los cuales en dos componentes se entregaron reforzadores constantes y en el tercero se entregaron reforzadores variados. Por lo tanto, también se determinó si el reforzamiento variado tenía efectos diferenciales para los sujetos que habían estado expuestos durante varias sesiones sólo a los reforzadores constantes y para los sujetos que se expusieron desde un principio tanto a los reforzadores constantes como a los reforzadores variados.

MÉTODO

Sujetos

Se usaron siete ratas Sprague Dawley de aproximadamente ocho meses de edad al inicio del experimento. Las ratas se mantuvieron al 80% de su peso ad libitum durante todo el experimento restringiendo la cantidad de comida que se les entregaba después de cada sesión. Cada una de las siete ratas permaneció en una caja habitación individual con acceso libre al agua dentro de un cuarto con la temperatura controlada y en el cual estaba en efecto un ciclo de luz-oscuridad de 12 hrs.

Aparatos

Se construyeron dos cámaras experimentales de 19 cm de largo, 23 cm de alto y 20 cm de fondo. Las paredes laterales y el techo de la cámara estaban hechos de Plexiglass® y el panel frontal y la pared trasera estaban hechos de aluminio. Cada cámara experimental se colocó dentro de un cubículo sonoamortiguado equipado con un ventilador que permitió la circulación del aire. En el panel frontal de cada cámara, a 3 cm de la pared izquierda había una apertura de 4.5 cm por 4.5 cm, detrás de la cual se encontraba un recipiente para pellets. La parte inferior de la apertura estaba a 1.5 cm del piso de la cámara. Se usó un dispensador de pellets Med Associates ® (Modelo ENV-203) para entregar pellets Noyes ® de 45 mg. Un sonalert Mallory® colocado en la parte posterior de la pared frontal emitía un tono de 0.5 s de duración cada vez que el dispensador de comida dejaba caer un pellet al recipiente. En el lado derecho del panel frontal, a 3 cm de la pared había una apertura circular detrás de la cual se colocó una caja metálica de 6 cm de diámetro. La caja metálica tenía un orifi cio de 1 cm de diámetro a través del cual las ratas podían obtener acceso a 0.2 ml de una solución de leche cada vez que un recipiente se levantaba por la acción de un solenoide. La solución de leche se preparó mezclando 50% de leche azucarada condensada de una marca comercial y 50% de agua. Cada entrega de la solución de leche consistió de 2 segundos durante los cuales el recipiente permanecía levantado a través del orifi cio. Además del ruido que el recipiente hacía al levantarse, cada entrega de la solución de leche se señaló encendiendo un foco que se encontraba junto a la apertura para el recipiente de la leche, en la parte posterior de la pared frontal. En el centro del panel frontal, a 9.5 cm del piso de la cámara, se colocó una palanca que sobresalía 5 cm dentro de la cámara. Arriba de la palanca, a 5 cm del techo de la cámara se colocaron tres focos de 28 v alineados horizontalmente y con una separación de 1 cm entre sí. En el centro de la pared trasera de la cámara, se colocó un foco de 28 v. Los eventos experimentales se controlaron y se registraron con una computadora con software Med-Pc® conectada a las cajas experimentales por medio de una interfaz Med Associates®.

Procedimiento

Las siete ratas se expusieron directamente a un programa múltiple de reforzamiento. En la Tabla 1 se muestra el orden de las condiciones experimentales para cada uno de los siete sujetos. En la primera condición, se expuso a cuatro de las siete ratas (Ratas J1, J2, J3 y J4) a un programa múltiple de dos componentes. En los dos componentes las presiones en la palanca fueron reforzadas conforme a un programa de IV 60 s. En uno de los componentes, las presiones a la palanca se reforzaron con la entrega de un pellet (IV pellets) y en el segundo componente se reforzaron con 2 s de acceso a la leche (IV leche). Ambos componentes tenían una duración de 120 s y cada sesión terminaba después de la presentación de 30 componentes (15 componentes en los que se entregó leche y 15 componentes en los que se entregó comida). La primera condición se condujo hasta que se observaran tasas de respuesta estables en ambos componentes. El criterio de estabilidad que se siguió fue que las tasas de respuesta en el bloque de las últimas tres sesiones no variaran más del 15% relativas a las tasas de respuesta del bloque de las penúltimas tres sesiones. Los números entre paréntesis en la Tabla 1 muestran el número de sesiones que se condujeron en cada condición para cada una de las ratas. Durante la segunda condición del experimento, se añadió un tercer componente al programa múltiple de reforzamiento para las Ratas J1, J2, J3 y J4. En el tercer componente, las presiones en la palanca resultaban en la entrega de leche o de pellets conforme al programa de IV 60s (IV pellets o leche). En este tercer componente, cada vez que se cumplía el requisito del IV, la entrega de leche o de pellets se presentó al azar, con la condición de que no ocurrieran más de tres entregas de pellets o más de tres entregas de leche de forma consecutiva. Durante la segunda condición del experimento, los tres componentes (IV pellets, IV leche, e IV pellets o leche) tenían una duración de 120 s, y cada sesión experimental terminaba después de la presentación de 30 componentes (i. e., 10 componentes de IV pellets, 10 componentes de IV leche y 10 componentes de IV pellets o leche). Durante la tercera condición del experimento se expuso nuevamente a las ratas J1, J2, J3 y J4 al programa múltiple de dos componentes (IV pellets, IV leche) hasta que se observaran tasas estables de respuesta. Como se muestra en la Tabla 1, para las Ratas A1, A2 y A3 únicamente se condujo la condición en la que el programa múltiple tenía tres componentes (IV pellets, IV leche, e IV pellets o leche). Durante todas las condiciones del experimento, cada componente se señaló consistentemente con un estímulo en particular. Los estímulos que se emplearon para señalar los tres componentes fueron el encendido de las luces del panel frontal, el encendido de la luz del panel trasero o bien el apagado de todas las luces de la cámara. Los estímulos que se usaron para cada uno de los tres componentes se contrabalancearon para los siete sujetos. En la Tabla 2 se presenta una lista de los estímulos asociados con cada uno de los tres componentes del programa múltiple para cada una de las siete ratas.

RESULTADOS

El interés del presente estudio se centró en los efectos del reforzamiento variado sobre el mantenimiento de la conducta. En la Figura 1 se muestra para todas las ratas el número de presiones a la palanca por minuto durante cada uno de los últimos seis días de cada condición del Experimento 1. Los círculos en cada panel representan la media de la tasa de respuesta en el componente en el que se entregó leche durante cada uno de los últimos seis días de cada condición y los cuadrados representan la media de la tasa de respuesta en el componente en el que se entregaron los pellets. En la primera columna de la Figura 1 se muestra la tasa de respuesta durante los últimos seis días de exposición al programa múltiple de dos componentes (IV leche, IV pellets) para las Ratas J1, J2, J3 y J4. Para los cuatro sujetos, la tasa de respuesta durante el componente en el que se entregó leche fue mayor que la tasa de respuesta durante el componente en el que se entregaron pellets. En la segunda columna de la Figura 1 se muestra la tasa de respuesta durante las últimas seis sesiones de la condición en las que se expuso a las ratas al programa múltiple de tres componentes (i. e., la condición en la que se añadió el componente de reforzamiento variado). Excepto para la Rata A3, la tasa de respuesta durante el componente en el que se entregó sólo leche fue mayor que la tasa de respuesta durante el resto de los componentes. Sólo para la Rata A3, la tasa de respuesta durante el componente de reforzamiento variado fue ligeramente mayor que la tasa de respuesta durante los componentes de reforzamiento constante. Para el resto de las ratas, la tasa de respuesta durante el componente de reforzamiento variado fue mayor que durante el componente en el que se entregaron pellets, pero menor que durante el componente en el que se entregó sólo leche. En la tercera columna de la Figura 1 se muestra la tasa de respuesta durante los últimos seis días de la segunda exposición al programa múltiple de dos componentes para las Ratas J1, J3 y J4. Debido a la muerte de la Rata J2 durante los primeros días de la última condición del experimento, los datos de esta rata no están en la gráfi ca. Al igual que en la primera exposición al programa múltiple de dos componentes, la tasa de respuesta durante el componente en el que se entregó leche fue mayor que durante el componente en el que se entregó comida para los tres sujetos.

DISCUSIÓN

Para seis de las siete ratas, la tasa de respuesta durante el componente de reforzamiento variado fue mayor que durante el componente en el que sólo se entregó comida, pero menor que durante el componente de reforzamiento constante en el que sólo se entregó la solución de leche azucarada. Sólo para una rata, la tasa de respuesta durante el componente de reforzamiento variado fue ligeramente mayor que la tasa de respuesta durante los componentes de reforzamiento constante. Por lo tanto, para seis de las siete ratas, el reforzamiento variado no tuvo efectos aditivos sobre la tasa de respuesta observada durante ambos componentes de reforzamiento constante. Este resultado se encontró tanto para las cuatro ratas que se expusieron al programa múltiple de dos componentes de reforzamiento constante previo a la inclusión del componente de reforzamiento variado como para dos de las tres ratas que se expusieron directamente al programa múltiple de tres componentes (reforzamiento constante y variado). Para estas ratas, la mayor tasa de respuesta se observó consistentemente durante el componente en el que se entregó la leche azucarada. Por lo tanto, para la mayoría de los sujetos, incluir la comida en el componente de reforzamiento variado tuvo el efecto de disminuir la tasa de respuesta relativo al componente en el que sólo se entregó la leche.

La comparación más directa del procedimiento empleado en el presente estudio es el experimento de Steinman (1968a) quien usó un programa múltiple de reforzamiento para comparar los efectos del reforzamiento constante y del reforzamiento variado sobre la tasa de respuesta en ratas. Al igual que en el presente estudio, Steinman encontró que la tasa de respuesta durante el componente en el que se entregó la solución azucarada fue mayor que la tasa de respuesta durante el componente en el que sólo se entregaron pellets. No obstante, a diferencia del presente experimento, Steinman reportó que la tasa de respuesta durante el componente de reforzamiento que entregó la solución de sucrosa y pellets (reforzamiento variado) fue mayor que durante los dos componentes de reforzamiento constante. El procedimiento de Steinman (1968a) incluyó exponer a las ratas a un programa de IV por comida. Posteriormente, Steinman expuso a las ratas a un programa múltiple de dos componentes de reforzamiento constante, en los que entregó la comida o la solución de sucrosa y una vez que se estabilizaron las tasas de respuesta añadió el componente de reforzamiento variado. Es incierto si haber expuesto a los sujetos a la comida por un mayor período de tiempo que la solución de sucrosa pudo determinar los resultados de Steinman. No obstante, en el presente experimento, no se observaron diferencias sistemáticas en la tasa de respuesta para las ratas que se expusieron sólo a los reforzadores constantes conforme al programa múltiple de dos componentes antes de introducir el componente de reforzamiento variado y para las ratas que se expusieron directamente al programa múltiple de tres componentes. Este hallazgo sugiere que la exposición a los reforzadores constantes previa a la inclusión del reforzamiento variado no fue la variable responsable de la discrepancia en los resultados entre ambos experimentos.

Existen diferencias entre el procedimiento de Steinman y el presente experimento, como las soluciones dulces empleadas, las duraciones de los componentes del programa múltiple y los estímulos que señalaron los componentes, por lo que conforme a los resultados del presente experimento no es posible determinar cuáles son las variables conducentes a generar tasas altas de respuesta al emplear reforzadores variados conforme a programas múltiples de reforzamiento.

Los hallazgos del presente experimento también difi eren con los hallazgos de Milo et al. (2010) quienes usaron un programa múltiple de reforzamiento para determinar los efectos del reforzamiento variado sobre la tasa de respuesta, empleando a sujetos humanos. Los autores usaron un programa múltiple RF10 RF10, conforme al cual reforzaron las presiones a un botón usando reforzadores constantes durante un componente y reforzadores variados durante el segundo componente. Encontraron que para todos los participantes, el número de respuestas fue mayor durante el componente de reforzamiento variado que durante el componente de reforzamiento constante. La discrepancia entre los resultados de los estudios previos al presente trabajo en los que se emplearon programas múltiples de reforzamiento y el presente experimento muestra que las variaciones cualitativas del reforzador no necesariamente resultan en un aumento en las tasas de respuesta relativo a la entrega de reforzadores constantes. El efecto aditivo en las tasas de respuesta del reforzamiento variado depende de manipulaciones experimentales específicas.

El interés del presente estudio se centró en el efecto del reforzamiento variado sobre la tasa de respuesta. Además del estudio de Milo et al (2010), Egel (1980) condujo un experimento en el que reportó que la tasa de respuesta era mayor al variar cualitativamente los reforzadores relativa a la tasa de respuesta que observó al entregar reforzadores constantes. En el Experimento 2 del presente estudio se arreglaron condiciones experimentales similares a las del estudio de Egel para determinar los efectos de variar la calidad del reforzador sobre la tasa de respuesta.

EXPERIMENTO 2

En el Experimento 1, no se replicó el hallazgo de que variar la calidad del reforzador resulta en una tasa de respuesta alta relativo a la entrega de reforzadores constantes, empleando programas múltiples de reforzamiento (Steinman, 1968a; Milio et al. 2010). Egel (1980) reportó que las variaciones cualitativas del reforzador resultaron en un aumento en el número de respuestas relativo a una condición en la que presentó reforzadores constantes. A diferencia de los estudios de Steinman y de Milo et al. en el experimento de Egel, la presentación de reforzadores constantes o bien de reforzadores variados se manipuló a través de diferentes sesiones. Empleando a niños como sujetos, en una primera condición de reforzamiento constante, Egel reforzó las presiones a la palanca entregando sólo uno de tres reforzadores para cada niño cada vez que los participantes presionaban la palanca. Posteriormente, durante la condición de reforzamiento variado, Egel entregó al azar los diferentes tipos de reforzadores cada que se cumplía el requisito de respuesta. Egel encontró que el número de presiones a la palanca fue mayor durante la condición de reforzamiento constante que durante la condición de reforzamiento variado y que las presiones a la palanca se mantuvieron por un mayor período de tiempo durante la condición de reforzamiento variado. En el Experimento 2 del presente trabajo se entregaron reforzadores constantes o bien reforzadores variados a través de diferentes sesiones, con el propósito de determinar si los reforzadores variados o constantes tenían efectos diferenciales sobre la tasa de respuesta empleando a ratas como sujetos.

MÉTODO

Sujetos

Los sujetos fueron cuatro de las siete ratas que se habían usado en el Experimento 1: Ratas A1, A2, A3 y J1. Las ratas se mantuvieron al 80% de su peso ad libitum durante todo el experimento restringiendo la cantidad de comida que se les entregaba después de cada sesión. Cada una de las cuatro ratas permaneció en una caja habitación individual con acceso libre al agua dentro de un cuarto con la temperatura controlada, y en el cual estaba en efecto un ciclo de luz-oscuridad de 12 hrs.

Aparatos

Se usaron las dos cámaras experimentales descritas en el Experimento 1.

Procedimiento

Se expuso directamente a los sujetos a un programa de IV 60 s que estuvo vigente durante sesiones de una hora. Las sesiones experimentales fueron de tres tipos: En el primer tipo de sesión, las presiones en la palanca resultaban en la entrega de leche conforme el programa de IV 60 s. Cada vez que se cumplía el requisito de respuesta, se levantó el recipiente que contenía 0.2 ml de la solución de leche azucarada condensada y agua al 50% durante 2 s. Durante el segundo tipo de sesión, las presiones a la palanca resultaban en la entrega de un pellet conforme al programa de IV 60s. El tercer tipo de sesión consistió en la entrega de reforzamiento variado (pellets o leche). Al igual que en el Experimento 1, cada vez que se cumplía el requisito del IV, la entrega de la leche o de los pellets se presentó al azar, con la condición de que no ocurrieran más de tres entregas de pellets o más de tres entregas de leche de forma consecutiva. Cada día se elegía al azar el tipo de sesión al cual se exponía a cada sujeto. Al igual que en el Experimento 1, el programa de IV consistió de 12 ciclos elegidos sin reemplazo, los cuales fueron programados conforme a la descripción de Fleshler y Hoffman (1962). Los tres tipos de sesión se condujeron hasta que se observaron tasas estables de respuesta. El criterio de estabilidad que se siguió fue que las tasas de respuesta en el bloque de las últimas tres sesiones no variaran más del 15% relativo a las tasas de respuesta del bloque de las penúltimas tres sesiones. Cada uno de los tres tipos de sesión se señaló con un estimulo en particular. En la Tabla 3 se presenta el estímulo asociado con cada uno de los tres tipos de sesión y el número de sesiones de cada tipo que se condujeron.

RESULTADOS

En la Figura 2 se presenta la tasa de respuesta durante los últimos seis días de exposición a cada uno de los tres tipos de sesión, esto es, durante las sesiones en las que se entregó sólo leche, durante las sesiones en las que se entregaron sólo pellets y durante las sesiones en las que se entregaron pellets o leche (reforzamiento variado). Este dato se presenta como la media del número de presiones a la palanca por minuto durante cada uno de los últimos seis días de exposición a cada uno de los tres tipos de sesión. Para todos los sujetos, la tasa de respuesta durante las sesiones en las que se entregó leche generalmente fue mayor que la tasa de respuesta durante las sesiones en las que se entregaron pellets y durante las sesiones de reforzamiento variado. Para las Ratas A1, A2 y J1, la tasa de respuesta durante las sesiones de reforzamiento variado fue menor que la tasa de respuesta durante las sesiones en las que se entregó leche y la tasa más baja de respuesta se observó durante las sesiones en las que sólo se entregaron pellets. Para la Rata A3, no se observaron diferencias sistemáticas en la tasa de respuesta durante las sesiones en las que se entregaron sólo pellets y durante las sesiones de reforzamiento variado

DISCUSIÓN

En el Experimento 2 se encontró que para la mayoría de las ratas, la tasa de respuesta durante las sesiones en las que sólo se entregó leche fue mayor que durante las sesiones de reforzamiento variado. La tasa de respuesta más baja se observó durante las sesiones en las que sólo se entregaron los pellets. Por lo tanto, se replicó el hallazgo del Experimento 1 relativo a que la variación cualitativa de los reforzadores no tuvo un efecto aditivo en las tasas de respuesta que resultaron de entregar los reforzadores constantes. Al igual que en el Experimento 1, añadir la comida durante las sesiones de reforzamiento variado resultó en disminuciones en la tasa de respuesta relativa a las sesiones en las que sólo se entregó la solución de leche azucarada. Por lo tanto, independientemente de que las variaciones en la calidad del reforzador se manipulen dentro de una misma sesión (Experimento 1) o bien a través de diferentes sesiones, el reforzamiento variado no resultó en una tasa de respuesta más alta relativo al reforzamiento constante. Las tasas de respuesta durante las sesiones de reforzamiento variado fueron cercanas al promedio de las tasas de respuesta observadas durante los dos tipos de sesiones en las que se entregó un reforzador constante.

Los hallazgos del presente experimento difi eren con los resultados de Egel (1980), quien empleó a niños como sujetos y reportó que variar la calidad del reforzador a través de diferentes sesiones resultó en un aumento en la tasa de respuesta. Independientemente de las diferencias ostensibles entre el procedimiento de Egel y el presente estudio, los resultados del presente experimento confi rmaron que las variaciones cualitativas del reforzador no necesariamente facilitan el mantenimiento de la conducta. Aún más, las variaciones en la calidad del reforzador pueden disminuir la tasa de respuesta relativa a la tasa de respuesta que se observa al entregar constantemente un tipo específi co de reforzador.

DISCUSIÓN GENERAL

El propósito general del trabajo fue comparar los efectos del reforzamiento cualitativamente variado y del reforzamiento constante sobre la tasa de respuesta usando ratas como sujetos. En el Experimento 1 se expuso a las ratas a un programa múltiple de reforzamiento IV60 s IV 60s, conforme al cual se entregaron reforzadores constantes en dos componentes y reforzadores cualitativamente variados en el tercer componente.

En el Experimento 2 se manipuló el tipo de reforzadores entregados a través de tres tipos diferentes de sesiones: dos de reforzamiento constante y uno de reforzamiento variado conforme a un programa de IV 60 s. En ambos experimentos, durante las condiciones de reforzamiento constante se entregó una solución de leche azucarada o pellets y en durante las condiciones de reforzamiento variado se entregaron la leche o los pellets de manera aleatoria. En los dos experimentos, para la mayoría de los sujetos, la tasa de respuesta más alta se observó durante el componente o bien durante las sesiones en las que sólo se entregó leche y la tasa de respuesta más baja se observó al entregar sólo los pellets. La tasa de respuesta durante las condiciones de reforzamiento variado fue menor que la tasa de respuesta que se observó cuando únicamente se entregó la leche. En el Experimento 1 del presente estudio no se replicaron los hallazgos de Steinman (1968) quien encontró que la tasa de respuesta durante un componente de reforzamiento variado fue mayor que la tasa de respuesta durante dos componentes de reforzamiento constante. Considerando que en el Experimento 2 también se encontró que la leche mantenía tasas más altas de respuesta que la leche y los pellets (reforzadores variados), es posible que el tipo de reforzadores empleados en el presente estudio hayan determinado la discrepancia entre los hallazgos de Steinman y los del Experimento 1 del presente trabajo. Tanto en el estudio de Steinman como en el presente estudio se entregaron pellets durante uno de los componentes de reforzamiento constante y durante el componente de reforzamiento variado. No obstante, Steinman también empleó una solución de sucrosa y agua al 30%, mientras que en el presente estudio se empleó la solución densa de agua y leche condensada (50%). Es posible que en el estudio de Steinman, la solución líquida de sucrosa y los pellets hubieran funcionado como reforzadores complementarios y por lo tanto se hubieran dotado mutuamente de propiedades reforzantes durante el componente de reforzamiento variado. Este argumento se basa en las demostraciones de que las ratas naturalmente alternan entre comer y beber y que las ratas comen más y beben más cuando tienen agua o comida disponibles (Fitzsimons & Le Magnen, 1969; Toates, 1980). En contraste, en el presente estudio, la solución densa de leche condensada, que además contiene grasa, pudo haber servido como un reforzador sustituto de la comida. En términos de la economía conductual, dos reforzadores son sustitutos si la disponibilidad de uno de los estímulos disminuye el valor reforzante del segundo estímulo, por ejemplo, al presentar dos fuentes idénticas de comida (ver Green & Freed, 1993 para una revisión).

En algunos estudios de conducta de comer en ratas, se mostró que en una situación de elección, las ratas consumen considerablemente más comida que contiene sustancias dulces que la comida que no las contiene (e. g., Capaldi, Bradford, Sheffer, & Pulley, 1989). Adicionalmente, se ha mostrado que en situaciones de elección, las ratas privadas de alimento consumen principalmente comida o soluciones altas en grasas (e. g., Sclafani & Ackroff, 1993; Schutz & Pilgrim, 1954). La preferencia por los alimentos dulces y altos en grasas puede explicar el hallazgo general del presente estudio de que para la mayoría de las ratas, la tasa de respuesta fue mayor durante las condiciones en las que sólo se entregó leche azucarada, seguida de la tasa de respuesta durante las condiciones de reforzamiento variado, en las que se entregó leche sólo en algunas ocasiones y en otras ocasiones comida. Por lo tanto en el presente estudio, el reforzamiento cualitativamente variado con pellets o leche resultó en una disminución en la tasa de respuesta relativo al reforzamiento constante con la leche azucarada. Conforme al procedimiento del presente estudio, no es posible establecer si la interacción entre los diferentes reforzadores empleados determinó las discrepancias entre los estudios de Steinman (1968a) de Egel (1980) y el presente estudio. Hacen falta más investigaciones empíricas para poner a prueba esta conclusión.

En los experimentos de Egel (1980; 1981) el autor no especifi có el criterio para seleccionar los reforzadores que usó, ni los tipos de reforzadores que empleó para cada niño. Egel únicamente aclaró que los estímulos que usó para cada participante habían servido como reforzadores en estudios previos y que se trataban de diferentes tipos de comida, como chocolates, uvas y helado. Los resultados de algunos de los estudios dentro del análisis conductual aplicado sobre reforzamiento variado sugieren que la preferencia de los sujetos por los diferentes estímulos juega un papel importante en los efectos del reforzamiento variado sobre la tasa de respuesta. Por ejemplo, Bowman et al. (1997) expusieron a sujetos humanos a un programa concurrente RF1 RF1, en el que una respuesta resultaba en la entrega de un reforzador clasifi cado como favorito mediante una prueba de preferencia y una segunda respuesta resultaba en la entrega de reforzamiento variado. Los reforzadores variados eran los estímulos que los participantes habían elegido en segundo, tercer y cuarto lugar. Sólo cuatro de los siete participantes respondieron más en la opción de reforzamiento variado que en la opción de reforzamiento constante. El estudio de Bowman sugiere que las variaciones cualitativas de los reforzadores puede resultar en un mayor número de respuestas que los reforzadores constantes, pero la variabilidad de los datos muestra que no es un efecto robusto. Asimismo, Koehler et al. (2005) mostraron que cuando la opción de reforzamiento variado incluía tres reforzadores que habían sido clasifi cados como menos favoritos y la opción de reforzamiento constante resultaba en el reforzador favorito, todos los participantes respondieron consistentemente en la opción de reforzamiento constante. Cuando Koehler et al. sustituyeron los reforzadores de la opción de reforzamiento constante por los reforzadores que los participantes habían elegido en segundo, tercer y cuarto lugar, la mitad de los participantes eligió la opción de reforzamiento variado. Los hallazgos de Bowman et al. y de Koehler et al. muestran que la preferencia por cierto tipo de reforzadores es determinante para obtener tasas de respuesta relativamente altas al variar los reforzadores cualitativamente.

En los dos experimentos del presente estudio, la tasa de respuesta mantenida por el reforzamiento variado fue cercana al promedio de las tasas de respuesta mantenidas por los reforzadores constantes (pellets y leche). La tasa de respuesta durante las condiciones de reforzamiento variado fue intermedia a las tasas de respuesta mantenidas por la leche y por los pellets, respectivamente. Surge la pregunta de si el hecho de que la leche haya tenido mayores propiedades reforzantes que la comida determinó la falta de un efecto aditivo de las tasas de respuesta durante las condiciones de reforzamiento variado. Los dos experimentos de Steinman (1968a; 1968b) sugieren que el hecho de que los reforzadores constantes mantengan tasas similares de respuesta o bien tasas diferenciales de respuesta es independiente del efecto aditivo del reforzamiento variado. No obstante, esta conclusión también parece estar limitada a la interacción entre los tipos específi cos de reforzadores empleados en términos de su valor reforzante.

Es posible concluir que la manipulación de variar la calidad de los reforzadores de ocasión en ocasión no necesariamente resulta en aumentos en la tasa de respuesta relativo a una condición en la que se entrega un solo reforzador consistentemente (cf. Cooper, Heron & Heward, 2007). Los reforzadores cualitativamente diferentes pueden mantener tasas de respuesta más altas que las tasas de respuesta mantenidas por los reforzadores constantes sólo bajo condiciones experimentales específi cas. Aún más, tal y como se mostró en los dos experimentos del presente estudio y en algunos de los estudios descritos con humanos (e. g., Koehler et al. 2005), variar la calidad del reforzador puede resultar en disminuciones de la tasa de respuesta relativo a una condición de reforzamiento constante.

Referencias

Bowman, L. G., Piazza, C. C., Fisher, W. W., Hagopian, L. P., & Kogan, J. S. (1997). Assessment of preference for varied versus constant reinforcers. Journal of Applied Behavior Analysis, 4, 345-350. [ Links ]

Capaldi, E. D., Bradford, J. P., Sheffer, J. D., & Pulley, R. J.(1989). The rat's sweet tooth. Learning and Motivation, 20, 178-190. [ Links ]

Cooper, J. O., Heron, T. E., & Heward, W. L. (2007). Applied behavior analysis (2a ed.). Upper Saddle River, N.J.: Pearson Prentice Hall. [ Links ]

Egel, A. L. (1980). The effects of constant vs. varied reinforcer presentation on responding by autistic children. Journal of Experimental Child Psychology, 30, 455-463. [ Links ]

Egel, A. L. (1981). Reinforcer variation: Implications for motivating developmentally disabled children. Journal of Applied Behavior Analysis, 14, 345-350. [ Links ]

Fitzsimons, T. J. & Le Magnen, J. (1969). Eating as a regulatory control of drinking in the rat. Journal of Comparative and Physiological Psychology, 67, 273-283. [ Links ]

Fleshler, M., & Hoffman, H. S. (1962). A progression for generating variable-interval schedules. Journal of the Experimental Analysis of Behavior, 5, 529-530. [ Links ]

Green, L., & Freed, D. E. (1993). The substitutability of reinforcers. Journal of the Experimental Analysis of Behavior, 60, 141-158. [ Links ]

Kimble, G. A. (1961). Hilgard and Marquis' conditioning and learning. New York: Appleton Century- Crofts. [ Links ]

Koehler, L. J., Iwata, B. A., Roscoe, E. M., Rolider, N. U., & O'Steen, L. E. (2005). Effects of stimulus variation on the reinforcing capability of nonpreferred stimuli. Journal of Applied Behavior Analysis, 38, 469-484. [ Links ]

Logan, F. A. (1960). Incentive: How the conditions of reinforcement affect the performance of rats. New Haven, CT: Yale University Press. [ Links ]

Logan, F. A., Beier, E. M., & Kincaid, W. D. (1956). Extinction following partial and varied reinforcement. Journal of Experimental Psychology, 52, 65-70. [ Links ]

Milo, J. S., Mace, F. C., & Nevin, J. A. (2010). The effects of constant versus varied reinforcers on preference and resistance to change. Journal of the Experimental Analysis of Behavior, 93, 385-394. [ Links ]

North, S. T., & Iwata, B. A. (2005). Motivational infl uences on performance maintained by food reinforcement. Journal of Applied Behavior Analysis, 38, 317-333. [ Links ]

Roca, A., & Bruner, C. A. (2007). Intromisión de una sesión de beber inducido por el programa en un período de 24 horas. Revista Mexicana de Análisis de la Conducta, 33, 61-78. [ Links ]

Sclafani, A. & Ackroff, K. (1993). Deprivation alters rats' fl avor preferences for carbohydrates and fats. Physiology and Behavior, 53, 1091-1099 [ Links ]

Steinman, W. M. (1968a). Response rate and varied reinforcement: Reinforcers of different strengths. Psychonomic Science, 10, 37-38. [ Links ]

Steinman, W. M. (1968b). Response rate and varied reinforcement: Reinforcers of similar strengths. Psychonomic
Science, 10, 35-36.

Schutz, H. G., & Pilgrim, F. J. (1954). Changes in self-selection pattern for purifi ed dietary components by rats after starvation. Journal of Comparative and Physiological Psychology, 47, 444-449. [ Links ]

Toates, F. M. (1980). Animal Behaviour: A systems approach. Chichester: Wiley. [ Links ]

Wunderlich, R. A. (1961). Strength of a generalized conditioned reinforcer as a function of variablility of reward. Journal of Experimental Psychology. 62, 409-415. [ Links ]

Received November 30, 2010
accepted January 13, 2011

¹⁾ Dirigir comentarios a Alicia Roca (alicia.roca@live.com) o a Kennon A. Lattal (Andy.Lattal@mail.wvu.edu). El primer autor está ahora en la Universidad Nacional Autónoma de México. El primer autor agradece el apoyo del programa PROFIP de la Dirección General de Asuntos del Personal Académico (DGAPA) de la UNAM por la beca proporcionada para realizar una estancia posdoctoral en la Universidad de West Virginia, durante la cual se realizó el trabajo.