19 3Supressão Condicionada Com Diferentes Estímulos Aversivos: Choque Elétrico e Jato de Ar QuenteFactores Contextuales en el recuerdo: Aportaciones experimentales y teóricas 
Home Page  


Acta Comportamentalia

 ISSN 0188-8145

Acta comport. vol.19 no.3 Guadalajara dez. 2011

 

História de aquisição do comportamento em um múltiplo FR-DRL: diferenciação e estabilidade das taxas de respostas

 

History of response acquisition on a multiple FR-DRL schedule of reinforcement: Differentiation and stability of response rates

 

 

Tatiany Honório Porto*, Murilo Nogueira Ramos** ; Carlos Eduardo Costa***

Universidade Estadual de Londrina

 

 


RESUMO

Estudou-se o efeito de diferentes histórias de aquisição, em um programa de reforço múltiplo FR-DRL, sobre a diferenciação nas taxas de respostas e sobre o tempo necessário (em minutos e número de sessões) para que a taxa de respostas atingisse estabilidade. Estudantes universitários foram distribuídos em quatro grupos com diferentes histórias de aquisição: Grupo 1- Incremento intra-sessão e não simultâneo do FR e do DRL (incremento primeiro do DRL e depois do FR); Grupo 2-Incremento intra-sessão e simultâneo do FR e do DRL; Grupo 3-Incremento do FR e do DRL inter-sessão e Grupo 4-Incremento dos FR e do DRL inter-sessão, com a diferença de que o critério para mudança de componente de tempo fixo (3 minutos) para esse grupo, enquanto para os Grupos 1, 2 e 3 o critério para mudança de componente foi a obtenção de 10 pontos. Após a aquisição todos os participantes foram expostos a um múltiplo FR 60 – DRL 20 s por 20 sessões em que a estabilidade do comportamento foi avaliada. A diferenciação nas taxas de respostas entre os componentes do múltiplo pode ser atingida com diferentes formas de se programar a aquisição do comportamento e os participantes de todos os grupos atingiram o critério de estabilidade em no máximo nove sessões de exposição.

Palavras chave: esquemas de reforçamento, esquema múltiplo, história de aquisição, fatores de procedimento, estabilidade, humanos.


ABSTRACT

Discrepancies in schedule performance are commonly observed between humans and non-humans. Three hypotheses are proposed to explain these discrepancies: verbal behavior, behavioral history and procedural variables. Various studies have been reported in which the effects of procedural variables on response rates have been assessed. One such variable is the history of acquisition of behavior in multiple schedules of reinforcement. With non-humans, the criterion generally used to change the components of the multiple schedule is the number of reinforcers, and with humans, components are generally changed after a fixed interval, independent of the organism's performance. The goal of the present study was to assess the effects of different histories of acquisition in a multiple fixed-ratio(FR) differential-reinforcement-of-low-rate (DRL) schedule on (a) the differentiation in response rates and (b) on the time (measured in minutes and number of sessions) for stable response rates min each component to be achieved. Twenty undergraduates participated, and were distributed in four groups. The response was pressing a button on the screen with the mouse cursor. For participants in Group 1, the parameters of the DRL were incremented within sessions, from 2 s until 20 s, and subsequently the parameters of the FR were increased from 10 until 60. For the participants in Group 2, the parameters of both schedules were incremented simultaneously, within sessions. For participants in Groups 3 and 4, the increments in the parameters of the schedule components were always conducted across sessions and the difference between these groups was the criterion for changing the components of the multiple schedule. For participants in Group 3, schedules components changed after 10 points were earned and for those in Group 4, changes in components occurred after 3 minutes had elapsed. The differentiation in response rates between components of the multiple schedule was achieved with each of these ways of arranging the acquisition of responding. In general, the different ways in which acquisition was programmed did not affect the time necessary to achieve stability in responding in a multiple FR-DRL (behavior was stable for participants in each group within a maximum of 9 sessions). Maintenance of this stability, with continued exposure to the schedule of reinforcement, also was not a function of the history of acquisition.

Keywords: Schedules of reinforcement, multiple schedule, history of acquisition, procedural variables, stability, humans.


 

 

As diferenças que podem ser verificadas entre o comportamento de humanos e não-humanos, quando submetidos a programas de reforço, ainda são alvos de polêmicas para a Análise Experimental do Comportamento - AEC (para uma revisão de quais são essas diferenças e uma discussão sobre elas ver, por exemplo, Lowe, 1979; Madden, Chase, & Joyce, 1998; Perone, Galizio, & Baron, 1988; Wanchisen, Tatham, & Mooney, 1989; Weiner, 1983). Três hipóteses foram levantadas para explicar estas diferenças. Uma delas diz respeito ao comportamento verbal. Por exemplo, as instruções dadas pelo experimentador (regras) ou as geradas pelo próprio indivíduo (auto-regras) poderiam determinar a discrepância no padrão comportamental de humanos e não-humanos sob programas de reforço (e.g., Catania, 1998; Hayes, 1987a; 1987b; Horne & Lowe, 1993; Lowe, 1979). Uma segunda hipótese é a de que a diferença seja devida a história comportamental – eventualmente, aquela anterior ao experimento – geralmente diferentes e com maior possibilidade de controle no caso de não-humanos do que de humanos (e.g., Wanchisen, 1990; Wanchisen & Tatham, 1991; Wanchisen, et al.,1989; Weiner, 1969; 1970; 1983). Finalmente, alguns autores sugerem que as diferenças de alguns fatores do procedimento utilizados em experimentos com humanos e não-humanos podem ser as responsáveis pela discrepância nos resultados (e.g., Bernstein, 1988; Matthews, Shimoff, Catania, & Sagvolden, 1977; Perone et al., 1988; Pilgrim & Johnston, 1988).

Alguns exemplos de fatores do procedimento que foram estudados com humanos são o tipo de consequência programada para o comportamento (e.g., Costa, Banaco, & Becker, 2005; Costa, Banaco, Longarezi, Maciel, & Sudo, 2008; de Freitas, 2009; Salgado, Cançado,& Costa, no prelo; Weiner, 1972), a possibilidade de emissão de uma resposta de consumação (e.g., Buskist, Miller, & Bennett, 1980; Costa, Patsko, & Becker, 2007; Matthews et al., 1977, Experimento 1; Raia, Shillingford, Miller Jr., & Baier, 2000), o uso de demonstração ou modelagem para a aquisição do comportamento (e.g., Matthews et al., 1977, Experimento 1), entre outros. Os resultados destes estudos sugerem que mudanças em alguns fatores do procedimento podem contribuir para diferenças nas taxas de respostas, não apenas entre espécies, mas também entre indivíduos de uma mesma espécie.

Outro fator de procedimento sugerido por Okouchi (2003) é a forma de se programar as contingências de reforço para que o comportamento fique sob controle de um programa de reforço múltiplo (a partir daqui será denominado de "história de aquisição do comportamento" a sequência inicial da programação das contingências de reforço em um dado experimento). Nos experimentos com não-humanos, a mudança de componente do programa múltiplo FR-DRL geralmente é feita com base no número de vezes que a contingência de cada componente é cumprida (e.g., Boren & Navarro, 1959; Freeman & Lattal, 1992; Knutson, 1970). Segundo Okouchi, utilizando esse procedimento, a taxa de respostas de não-humanos geralmente é diferenciada (e.g., altas taxas em FR e baixas taxas em DRL). Experimentos com humanos que adotaram procedimento semelhante a esse também obtiveram diferenciação na taxa de respostas em programas de reforço múltiplo (e.g., Costa, Soares, & Ramos, submetido; Okouchi, 1996; 1999; 2002; Soares, 2008).

Todavia, nos experimentos com humanos que utilizaram um critério de tempo fixo para mudança de componente do programa de reforço (de 2 a 3 minutos em cada componente) não foi observada a diferenciação na taxa de respostas esperada no múltiplo FR-DRL para alguns dos participantes. Por exemplo, no estudo de Hayes, Brownstein, Zettle, Rosenfarb e Korn (1986), três de quatro participantes de um grupo que recebeu instrução mínima1 não apresentaram a diferenciação esperada na taxa de respostas. No estudo de Hayes, Brownstein, Haas e Greenway (1986), 13 de 19 participantes, não apresentaram a diferenciação na taxa de respostas; no estudo de Rosenfarb, Newland, Brannon e Howey (1992), nove de 10 participantes, e em Wulfert, Greenway, Farkas, Hayes e Dougher (1994), três de 15 participantes, não apresentaram a diferenciação esperada nas taxas de respostas em um programa múltiplo FR-DRL2.

Apesar dos resultados dos estudos citados sugerirem que a história de aquisição do comportamento foi responsável pela diferenciação das taxas de respostas sob um programa de reforço múltiplo, cada um dos estudos tinha um objetivo diferente, que não englobava o arranjo da história de aquisição e, por isto, nenhum dos estudos comparou diretamente o efeito das diferentes sequências iniciais da programação das contingências de reforço em um programa de reforço múltiplo. A comparação entre histórias de aquisição do comportamento foi um dos objetivos do presente estudo.

Outro ponto relevante na AEC diz respeito à estabilidade da taxa de respostas. Nas pesquisas com não-humanos a avaliação da estabilidade do comportamento é facilitada porque é comum expor os sujeitos a cada condição do experimento por várias sessões consecutivas. A tendência é que as sessões sejam mais longas e com um intervalo mais regular entre uma sessão e outra (geralmente de 23 a 24 horas) quando comparada com as sessões programadas com humanos. Com humanos, geralmente, todo o experimento é composto por poucas sessões e é comum que os participantes sejam expostos a um período de tempo menor do que não-humanos em cada condição. Essa breve exposição às condições experimentais não garante que a taxa de respostas esteja livre de efeitos residuais de variáveis que afetaram anteriormente o comportamento (Shull & Lawrence, 1998). Em resumo, no caso de humanos, as práticas de pesquisas são muito mais variadas e as demonstrações de estabilidade muitas vezes não alcançam os padrões utilizados nos laboratórios com não-humanos (Baron & Perone, 1998).

Existem diversas pesquisas que descrevem exposições às condições experimentais de longa duração com não-humanos, entre elas estão, por exemplo, todo o livro de Ferster e Skinner (1957) e o estudo de Cumming e Schoenfeld (1960). Por outro lado, com humanos elas são escassas. Uma descrição do comportamento de humanos expostos por períodos prolongados a programas de reforço, com ênfase na estabilidade da taxa de respostas, poderia lançar luz sobre a polêmica questão das diferenças no comportamento de humanos e não-humanos em programas de reforço (cf. Bernstein, 1988).

Os três tipos de critérios de estabilidade comumente encontrados na literatura da área são o critério visual, o de tempo fixo e o quantitativo (Baron & Perone, 1998; Johnston & Pennypacker, 1993; Kazdin, 1982; Perone, 1991; Sidman, 1960). O critério utilizado no presente trabalho foi o quantitativo que, segundo Baron e Perone, na sua forma mais comum é empregado como uma variação aceitável na taxa de respostas, definida por um critério arbitrário, que pode ser expressa tanto em termos absolutos (número de respostas) quanto em termos relativos (porcentagem). Uma das formas de se avaliar a estabilidade utilizando um critério quantitativo foi sugerida por Schoenfeld, Cumming e Hearst (1956) e retomado por Cumming e Schoenfeld (1960). Neste critério, toma-se o bloco das seis últimas sessões e verifica-se se a diferença entre a média da taxa de respostas das três primeiras sessões do bloco e a média da taxa de respostas das três últimas sessões do bloco é menor que 5% da média da taxa de respostas do bloco inteiro de seis sessões. A Equação 1 abaixo descreve o cálculo da estabilidade segundo esse critério.

 

 

Onde,

I.E. = índice de estabilidade;

Sn = taxa de respostas na sessão n.

O número de sessões consideradas para análise e a porcentagem de variação considerada como "aceitável" variam de estudo para estudo. Entretanto, como o critério calcula a porcentagem de variação em relação à média de sub-blocos de sessões, quanto maior o número de sessões consideradas para análise, maior a probabilidade da média esconder variações entre sessões, e por isso, menos rigoroso é o critério (Perone, 1991).

Se fatores do procedimento podem afetar o desempenho de humanos em programas de reforço, é plausível supor que alguns fatores do procedimento poderiam afetar, entre outras coisas, o tempo necessário para que a estabilidade da taxa de respostas seja atingida e mantida. Dentre diversos fatores de procedimento, a história de aquisição do comportamento parece variar entre diversos estudos. Estudar seus efeitos sobre o desempenho subseqüente pode lançar luz sobre possíveis variáveis responsáveis pela variabilidade encontrada em alguns dados experimentais com humanos.

A pergunta geral que guiou o presente estudo foi: a história de aquisição do comportamento em um programa de reforço múltiplo pode influenciar a diferenciação na taxa de respostas (tais como o múltiplo FR-DRL) e também afetar a estabilidade na taxa de respostas entre sessões consecutivas? Portanto, os objetivos da presente pesquisa foram: 1) verificar os efeitos de diferentes sequências de se programar as contingências de reforço para a aquisição do comportamento3 em um múltiplo FR-DRL sobre o tempo necessário (em minutos e número de sessões) para que a aquisição do comportamento tenha sido completada e sobre a diferenciação nas taxas de respostas, 2) descrever a estabilidade da taxa de respostas ao longo de sessões consecutivas de exposição a um programa múltiplo FR 60-DRL 20 s e verificar se é possível traçar alguma relação entre a história de aquisição do comportamento e a estabilidade da taxa de respostas.

 

Método

Participantes

Participaram 21 universitários de ambos os sexos (14 mulheres e 7 homens) com idades entre 18 e 26 anos ( x = 21 ±2,61), que não estavam matriculados no curso de Psicologia, não tinham conhecimento sobre programas de reforço e não possuíam diagnóstico ou queixa de L.E.R. (lesão por esforço repetitivo). Não houve nenhuma preocupação quanto a distribuição dos participantes nos grupos que compõem a pesquisa em função do gênero porque: (a) o problema de pesquisa e o método utilizado não indicavam tal necessidade e (b) a maioria das pesquisas em Análise Experimental do Comportamento Humano não se preocupa com a diferença entre gêneros (cf. Morris, Johnson, Todd & Higgins, 1988) – a não ser, claro, que o problema de pesquisa "exija" que este balanceamento seja adotado.

Equipamentos e Instrumentos

Equipamentos: foram utilizados dois computadores do tipo PC, com monitor em cores de 14 polegadas, mouse e teclado padrões; dois gravadores (Panasonic® Slim Line, modelo RQ-2103 e Sony® modelo TCM) ambos com fones de ouvido Grove, modelo HD-3030.

Instrumentos: Utilizou-se para coleta de dados o software ProgRef v3.1 (Costa & Banaco, 2002; 2003). Nele o participante interagia com uma tela cinza, contendo um retângulo (de 10,5 x 2,5 cm) em seu centro inferior. Sobre tal retângulo (botão de respostas) eram emitidas as respostas, que consistiam de pressões no botão esquerdo do mouse com o cursor localizado sobre o botão de respostas. Quando a exigência de um determinado programa de reforço era cumprida, aparecia, no canto superior direito da tela, a figura estilizada de uma carinha risonha (smile). O participante deveria, então, clicar no botão esquerdo do mouse com o cursor sobre outro retângulo (botão de resposta de consumação) – situado também no canto superior direito do monitor – para que o smile desaparecesse e um ponto fosse registrado no visor de pontuação, visível durante toda a sessão experimental e localizado acima do botão de respostas. No programa de reforço DRL, o intervalo tinha início após o aparecimento do smile e não após a emissão da resposta de consumação. Portanto, o tempo gasto pelo participante para deslocar o cursor do mouse do botão de respostas até o botão de respostas de consumação e voltar novamente para o botão de respostas era computado como parte do intervalo do DRL (e da pausa pós-reforço). A cor do botão de respostas mudava em cada um dos componentes do programa múltiplo.

Para a análise da estabilidade foi utilizado o software Stability Check v.1 (desenvolvido pelo professor Carlos Eduardo Costa da Universidade Estadual de Londrina). Uma descrição do software e a versão para download poderá ser encontrada em www.caecosta.com.br. Local

A coleta de dados foi realizada em duas salas experimentais do Laboratório de Análise Experimental do Comportamento Humano (LAECH) da Universidade Estadual de Londrina, que media, aproximadamente, 27 m2. Cada sala experimental media, aproximadamente, 3m 2, com divisórias de 2,10 m de altura e continha uma mesa, uma cadeira, um ventilador, um gravador com fone de ouvido e um computador com teclado e mouse.

Procedimento

Os participantes liam e, se concordassem em participar da pesquisa, assinavam o Termo de Consentimento Livre e Esclarecido (TCLE)4.O TCLE informava ao participante que o objetivo da pesquisa era "estudar algumas variáveis que possam afetar o modo como as pessoas se comportam em determinadas situações", o número de sessões e o tempo aproximado da duração dessas sessões e que os participantes poderiam abandonar o experimento a qualquer momento, sem nenhum prejuízo. Os participantes foram distribuídos em quatro grupos, por sorteio, antes da primeira sessão. Em seguida, era pedido ao participante que deixasse todo material, incluindo celular e relógio, fora da sala experimental.

Os participantes receberam, por escrito, a seguinte instrução:

"Esse estudo não consiste em uma pesquisa sobre inteligência ou personalidade. Seu objetivo será ganhar pontos utilizando apenas o mouse. Os pontos aparecerão em uma janela (contador) que se localizará na parte superior da tela do computador na posição central. O experimentador não está autorizado a dar qualquer informação adicional. Caso houver dúvidas, releia o texto acima e prossiga o experimento. Bom trabalho!"

Assim que os participantes entravam na sala experimental, era pedido que colocassem o fone de ouvido pelo qual soava um "ruído branco". Para cada participante, eram realizadas até duas sessões por dia, pelo menos duas vezes por semana de segunda à sexta-feira. Ao final de cada sessão, cada ponto obtido era trocado por R$ 0,05 (cinco centavos).

Esse experimento foi composto de duas fases utilizando-se um múltiplo FR-DRL. Em ambas as fases, quando o FR estava em vigor, a cor do botão de resposta era azul e quando o DRL estava em vigor, a cor do botão era amarela. Um período de time-out (TO) de 5 segundos foi programado entre os componentes do múltiplo. Durante o TO, aparecia uma tela escura com a palavra "AGUARDE" escrita em vermelho (os botões e o contador de pontos eram ocultados durante o TO). A alternância entre os componentes sempre foi simples (i.e., em todas as sessões o componente sempre mudava de FR para DRL e vice-versa, começando sempre pelo FR e terminando com o DRL). Quando a alternância entre os componentes era baseada na passagem do tempo (durante a segunda fase do experimento para os Grupos 1, 2 e 3 e durante todo o experimento para o Grupo 4), não havia contingência de carry-over habilitada, ou seja, as respostas emitidas (ou um intervalo de tempo transcorrido), não eram "carregadas" para a próxima apresentação desse componente do múltiplo. Por exemplo, em um múltiplo FR 60-DRL 20 s um participante ganhava pontos no FR (Componente 1) a cada 60 respostas emitidas. Se o participante emitisse 40 respostas e o intervalo de tempo de exposição àquele componente terminasse (e.g., depois de 3 minutos, como foi para os participantes do Grupo 4), estas 40 respostas não seriam computadas para a próxima exposição ao FR. A mesma lógica se aplicava para o intervalo de um DRL. Um resumo do procedimento utilizado é apresentado na Tabela 1.

 

 

Na primeira fase (história de aquisição) eram programadas três sessões, para todos os participantes, nas quais os parâmetros5 do FR e DRL progrediam até que se atingisse um múltiplo FR 60-DRL 20 s. Para os participantes do Grupo 1, a razão em FR era mantida constante nas duas primeiras sessões (FR 10), e o intervalo do DRL era aumentado em 2 s a cada 10 pontos obtidos (de DRL 2 s a DRL10 s, na primeira e de DRL 12 s a DRL 20 s, na segunda sessão). Na terceira sessão, a razão do FR era aumentada em 10, a cada 10 pontos obtidos (de FR 20 a FR 60), e o intervalo do DRL era mantido constante em 20 s. Portanto, nesta fase, cada componte (FR ou DRL) permanecia em vigor até que 10 pontos fossem obtidos (indepententemente de quanto tempo isso durasse).

Para os participantes do Grupo 2, a progressão nos parâmetros era realizada tanto para o FR (de 4 em 4) quanto para o DRL (de 1 em 1 s nas duas primeiras sessões e de 2 em 2 s na terceira sessão), a cada 10 pontos obtidos, da primeira até a terceira sessão. Portanto, também para os participantes desse grupo, nesta fase, cada componte (FR ou DRL) permanecia em vigor até que 10 pontos fossem obtidos (indepententemente de quanto tempo isso durasse). Para os participantes dos Grupos 3 e 4 a progressão dos parâmetros do FR e DRL eram realizados sempre entre as sessões (i.e., nenhum aumento nos parâmetros de cada programa de reforço era feito intra-sessão como nos Grupos 1 e 2). A sequência nas três sessões era: FR 15-DRL 5 s; FR 30-DRL 10 s e FR 60-DRL 20 s. A diferença entre os Grupos 3 e 4 era o critério para a mudança dos componentes do programa múltiplo. Para os participantes do Grupo 3, nesta fase, cada componte (FR ou DRL) permanecia em vigor até que 10 pontos fossem obtidos (indepententemente de quanto tempo isso durasse) e para os participantes do Grupo 4 os componentes se alternavam a cada 3 minutos (independentemente de quantos pontos o participante havia obtido).

Nesta primeira fase (história de aquisição), para os participantes dos Grupos 1, 2 e 3, a sessão era encerrada quando os participantes ganhavam o 10º ponto na última apresentação do DRL ou atingissem um tempo máximo de 60 minutos de sessão e, para os participantes do Grupo 4, a sessão era encerrada após 30 minutos. Caso algum participante dos Grupos 1, 2 e 3 não terminasse a sessão no prazo de 60 minutos, a sessão era interrompida e uma nova sessão agendada. Na sessão seguinte, as contingências iniciais eram programadas a partir do último componente que o participante cumpriu da sessão anterior. Por exemplo, se um participante do Grupo 1 atingisse os 60 minutos de sessão enquanto estivesse no componente de FR 40 da terceira sessão, sua sessão era interrompida e a próxima sessão iniciava no último componente de FR que ele cumpriu (FR 30). Após 10 pontos recebidos em FR 30, o programa passaria para o DRL 20 s e depois para FR 40 e assim por diante. Para os participantes do Grupo 4 o critério para se repetir uma sessão foi baseado no número de pontos obtidos no componente de DRL. Ou seja, embora o desempenho não determinasse o término da sessão, ele determinava se o participante repetiria ou não uma mesma sessão. A primeira sessão (múltiplo FR 15-DRL 5 s) não era repetida qualquer que fosse o desempenho do participante do Grupo 4. A partir da segunda sessão (múltiplo FR 30-DRL 10 s), se o participante não obtivesse 70% dos pontos possíveis no DRL, a sessão era repetida. Porém, os resultados iniciais de um dos participantes (P17 do Grupo 4) sugeriram que esse critério era muito rígido e, então, decidiu-se reduzi-lo para 65% dos pontos possíveis no DRL. Se uma mesma sessão fosse repetida por mais de três vezes seguidas, o participante, de qualquer um dos grupos, era dispensado da pesquisa.

Para todos os grupos, considerou-se que um participante havia completado a aquisição do comportamento no programa de reforço múltiplo (i.e, que ele havia atingido o "critério de aquisição") se ele atingisse os parâmetros do programa de reforço múltiplo FR 60-DRL 20 s sem repetir uma mesma sessão por mais de três vezes. Portanto, avaliou-se o tempo necessário (em número de sessões e minutos de exposição) para que a aquisição do comportamento fosse atingida segundo esse critério.

Em resumo, a "história de aquisição do comportamento" envolveu três procedimentos principais: (1) progressão não simultânea vs. progressão simultânea intra-sessão dos parâmetros dos programas de reforço do múltiplo FR-DRL (Grupo 1 vs. Grupo 2); (2) progressão intra-sessão vs. progressão exclusivamente inter-sessão dos parâmetros dos programas de reforço do múltiplo FR-DRL. (Todos os grupos, em certo sentido, eram submetidos à progressão dos parâmetros inter-sessão. Todavia, apenas nos Grupos 3 e 4 a progressão era exclusivamente inter-sessões). Comparações do Grupo 2 vs. do Grupo 3 podem lançar alguma luz sobre esta manipulação específica na história de aquisição e (3) a mudança de componente do programa múltiplo FR-DRL por número fixo de pontos obtidos dentro do componente vs. por tempo fixo (Grupo 3 vs. Grupo 4).

Na segunda fase (estabilidade), os participantes de todos os grupos eram submetidos a 20 sessões de 30 minutos em um programa de reforço múltiplo FR 60-DRL 20 s. Cada componente do programa era apresentado alternadamente por três minutos. Como na fase anterior, toda sessão iniciava pelo componente de FR e cada componente era apresentado cinco vezes em uma mesma sessão.

A análise da estabilidade do desempenho foi realizada utilizando o critério de Schoenfeld et al. (1956) considerando-se quatro sessões consecutivas, com a variação máxima de 10% para o componente de FR. Para o componente de DRL eram utilizadas para análise também quatro sessões consecutivas e o comportamento era considerado estável se a variação na taxa de respostas entre as sessões fosse, no máximo, de três respostas por minuto (desde que não houvesse tendência a aumentar ou diminuir a taxa de respostas entre sessões). Adotaram-se critérios diferentes para cada um dos programas de reforço porque as taxas de respostas no DRL eram muito baixas e o critério de Schoenfeld et al. leva em conta a porcentagem de variação entre a média das taxas de respostas de dois sub-blocos em relação à média de todas as sessões do bloco. Com isso, qualquer variação de uma resposta por minuto poderia ser apontada como uma variação grande em termos de porcentagem (cf. Perone, 1991). A taxa de respostas de um participante só era considerada estável se preenchesse os critérios dos dois componentes em uma mesma sessão.

 

Resultados

A Figura 1 mostra a duração em minutos das sessões de aquisição do comportamento de pressionar um botão em um programa de reforço múltiplo FR-DRL (no eixo y à esquerda) e a média de pontos ganhos por sessão (no eixo y à direita) dos participantes dos Grupos 1, 2, 3 e 4.

 

 

É possível observar, na Figura 1, que houve variabilidade entre participantes no tempo necessário para se atingir o critério de aquisição do comportamento. Um participante do Grupo 1 (P3) não atingiu esse critério. Quando o DRL atingiu o valor de 10 segundos esse participante passou a levar muito tempo para ganhar os 10 pontos programados (i.e., o limite máximo de 60 minutos de sessão era atingido antes que 10 pontos fossem obtidos no DRL). Após sete sessões P3 não havia cumprido a exigência de 10 pontos sob DRL 14 s e foi dispensado da pesquisa (os resultados deste participante não foram incluídos nas análises subsequentes). Os cinco participantes restantes do Grupo 1 terminaram a fase de aquisição nas três sessões planejadas, cujo tempo total variou, aproximadamente, entre 72 e 102 minutos ( x = 85 σ = ±14). O tempo necessário para os participantes do Grupo 2 completarem a fase de aquisição variou aproximadamente entre 66 e 190 minutos ( x = 105 σ = ±50). P8, do Grupo 2, precisou de cinco sessões para completar a fase de aquisição do comportamento e o fez em aproximadamente 190 minutos. Menor variabilidade entre participantes – no número de sessões e no tempo necessário para completar a fase de aquisição – foi observada no Grupo 3. Todos os participantes completaram a fase de aquisição do comportamento em três sessões e o fizeram entre, aproximadamente, 80 e 100 minutos ( x = 89 σ = ±7). A duração das sessões do Grupo 4 era fixa (30 minutos cada), então, o tempo mínimo para completar as sessões da fase de aquisição do comportamento foi 90 minutos e o máximo foi 150 minutos ( x = 114 σ = ±33). Dois participantes do Grupo 4 (P17 e P20) precisaram de cinco sessões para completar a fase de aquisição do comportamento (ambos repetiram três vezes a sessão de FR 30-DRL 10 s). Todavia, vale ressaltar que o participante P17 repetiu sessões porque não atingiu o critério de ganhar, pelo menos, 70% dos pontos disponíveis em DRL. Se o critério adotado posteriormente (de ganhar, pelo menos, 65% dos pontos disponíveis) tivesse sido adotado com P17 ele teria completado a aquisição em três sessões.

De qualquer modo, excluindo-se os dados do P3 do Grupo 1 que não completou a fase de aquisição, a ANOVA não revelou diferença significante na duração (em minutos) da fase aquisição do comportamento entre os quatro grupos (F[3,16] = 0,993; p = 0,421). Se, além do tempo total necessário para completar a fase de aquisição do comportamento, for considerado também o número de participantes que completaram esta fase em menor tempo e com menor variabilidade entre participantes (conforme Figura 1), a programação da aquisição que aparentemente gerou o "melhor" desempenho foi aquela do Grupo 3.

Os participantes do Grupo 4 obtiveram mais pontos por sessão do que aqueles dos demais grupos (em média, 80 pontos por sessão acima do que os participantes dos demais grupos obtiveram), porque a mudança de componentes e o término da sessão não eram programados pelo número de pontos recebidos para esse grupo (o número de pontos obtidos – e apenas no DRL – determinava a repetição ou não de uma sessão, mas não seu encerramento ou mudança de componente). Os participantes do Grupo 1 (exceto P3); e dos Grupos 2; 3 e 4 receberam em média 100; 92,6; 100 e 181,4 pontos por sessão, respectivamente. A ANOVA revelou diferenças significantes na média de pontos ganhos do Grupo 4 em relação a todos os demais grupos (F[3,16 ] = 42,519; p = 0,000).

A Tabela 2 exibe o índice de diferenciação (ID) dos participantes dos Grupos 1, 2, 3 e 4 durante as sessões da fase de aquisição do comportamento. O ID serviu para avaliar a diferenciação nas taxas de respostas entre os componentes do programa múltiplo (esse cálculo foi efetuado post hoc, i.e., não serviu como parâmetro para se considerar a aquisição do comportamento como tendo sido atingida). O critério foi proposto por Rosenfarb et al. (1992) e foi calculado dividindo-se a taxa de respostas no FR pela soma da taxa de respostas nos dois componentes (FR e DRL). O resultado varia de 0 a 1. Valores menores que 0,5 indicam que a taxa de respostas no componente de DRL foi maior que no de FR e quanto mais próximo de 1 maior a diferenciação nas taxas de respostas entre os componentes do múltiplo.

 

 

As Figuras 2, 3, 4 e 5 exibem as taxas de respostas de todos os participantes no programa de reforço múltiplo FR-DRL nas sessões da fase de aquisição do comportamento (à esquerda da linha pontilhada vertical) e nas sessões subsequentes de exposição ao múltiplo FR 60-DRL 20 s (à direita da linha pontilhada vertical). O retângulo em cada um dos gráficos contém as sessões em que o critério de estabilidade foi atingido, tanto em FR quanto em DRL.

 

 

 

Observa-se na Tabela 2 que, na última sessão da fase de aquisição do comportamento, os participantes de todos os grupos atingiram um alto índice de diferenciação (ID>0,90), indicando altas taxas de respostas no FR e baixas taxas no DRL. Durante a fase de aquisição (Figuras 2, 3, 4 e 5; sessões à esquerda da linha pontilhada), percebe-se que a taxa de respostas no FR foi maior que a taxa de respostas no DRL desde a primeira sessão para a maioria dos participantes (exceto P22 do Grupo 1; P6, P7 e P9 do Grupo 2). A diferença entre as taxas de respostas dos dois componentes foi aumentando ao longo das sessões de exposição ao múltiplo FR-DRL, ficando acima de 177 respostas por minuto (R/min) no componente de FR e abaixo de 15 R/min no componente de DRL na última sessão da fase de aquisição para todos os participantes.

Apesar de P17 e P20 do Grupo 4 repetirem sessões, ambos atingiram IDs altos nas sessões que precisaram repetir (de 0,95 a 0,98 – ver Tabela 2). Isso se deve, provavelmente, ao fato do critério utilizado para repetir sessões ter sido muito exigente. Para melhor ilustrar o problema, a Figura 6 apresenta o registro cumulativo da segunda sessão da fase de aquisição de um participante de cada grupo.

Os participantes P1, P7 e P12 (dos Grupos 1, 2 e 3, respectivamente) ganharam os 10 pontos em cada componente do programa de reforço múltiplo FR-DRL e não precisaram repetir a sessão. Conforme pode ser observado na Tabela 2, o ID desses participantes na segunda sessão da fase de aquisição foi 0,93; 0,85 e 0,87 (P1, P7 e P12, respectivamente). P20 (do Grupo 4) precisou repetir a Sessão 2, pois obteve 53% dos pontos possíveis no DRL e o critério era a obtenção de, pelo menos, 65% dos pontos disponíveis. Apesar disso, o ID de P20 nesta segunda sessão foi de 0,96 e o registro cumulativo visto na Figura 6 sugere que o comportamento desse participante estava sob controle diferencial de cada componente do múltiplo FR-DRL, tanto quanto dos outros participantes.

Com relação à estabilidade da taxa de respostas no múltiplo FR 60-DRL 20 s, a inspeção visual dos gráficos (porção à direita da linha pontilhada vertical) das Figuras 2, 3, 4 e 5 sugere que apenas alguns participantes (P2 e P4 do Grupo 1; P7 e P9 do Grupo 2; P13 do Grupo 3 e P19 do Grupo 4) variaram, em maiores proporções, a taxa de respostas no componente de FR, mas, aparentemente, não seguiram nenhuma tendência. Apesar dessas variações, as taxas de respostas emitidas permaneceram sempre nos mesmos níveis, i.e., no FR sempre taxas altas de respostas, superiores àquelas do DRL (a diferenciação na taxa de respostas manteve-se até o final das 20 sessões de exposição).

Excluindo-se as sessões de aquisição e considerando o número de sessões necessárias para que o critério de estabilidade da taxa de respostas fosse atingido em ambos os componentes do programa múltiplo de reforço, os participantes do Grupo 1 precisaram em média de 5,4 ±1,5 sessões; os participantes do Grupo 2 precisaram em média de 6,4 ±2,0 sessões; os participantes do Grupo 3 precisaram em média de 4,8 ±1,3 sessões e os participantes do Grupo 4 precisaram, em média, de 4,6 ±0,8 sessões. A ANOVA não revelou diferença significante entre os grupos (F[3,16] =1,436; p = 0,269) no número de sessões necessárias até que o critério de estabilidade fosse atingido.

Portanto, o modo como a fase de aquisição do comportamento foi arranjada parece não ter influenciado substancialmente o tempo necessário para que os participantes atingissem o critério de estabilidade. Apesar de dois participantes do Grupo 2 terem precisado de oito e nove sessões para atingirem a estabilidade (P7 e P6, respectivamente), todos os grupos tiveram participantes que atingiram a estabilidade em ambos os componentes nas quatro primeiras sessões de exposição, logo após as sessões da fase de aquisição do comportamento (e.g., P1, P8, P11, P16) e todos os grupos tiveram participantes que levaram de seis a sete sessões, depois das sessões da fase de aquisição, para atingir o critério de estabilidade da taxa de respostas (por exemplo, P4, P10, P13 e P20).

As sessões adicionais na fase de aquisição realizadas pelos participantes P8 (Grupo 2) e P17 e P20 (Grupo 4) teriam influenciado o tempo necessário para que o critério de estabilidade fosse alcançado (i.e., reduzindo o tempo necessário para que a estabilidade fosse atingida na fase subsequente)? Aparentemente não. Se por um lado P8 e P17 atingiram a estabilidade nas quatro primeiras sessões após a aquisição, P20 precisou de seis sessões para atingi-la (e todos realizaram duas sessões adicionais na fase de aquisição). Além disso, outros participantes atingiram a estabilidade em quatro sessões, mesmo não tendo realizado sessões adicionais durante a fase de aquisição (P1, P21, P11, P12, P15, P16 e P18).

Como a escala dos gráficos das taxas de respostas (Figuras 2, 3, 4 e 5) utilizou valores altos para poder conter as taxas de respostas no FR, as variações das taxas de respostas no DRL não podem ser observadas claramente, pois as taxas de respostas em DRL foram baixas e as mudanças foram de pequena magnitude. Essas mudanças podem ser mais bem observadas nas Figuras 7, 8, 9 e 10.

 

 

 

As Figuras 7, 8, 9 e 10 exibem a proporção de mudança da média nas taxas de respostas nos componentes do múltiplo FR-DRL em cada bloco de sessões, em relação à média das quatro primeiras sessões na qual os participantes atingiram estabilidade (Bloco 1- Bl 1). A linha pontilhada horizontal marca sempre o valor do Bloco 1 e foi utilizada para comparar a variação entre o Bloco 1 e os demais blocos. A proporção de mudança em relação ao Bloco 1, foi calculada utilizando-se blocos compostos de quatro sessões consecutivas, com exceção do último bloco que poderia ser composto por quatro ou mais sessões, de acordo com as sessões que compunham o primeiro bloco em que o participante atingiu estabilidade. Por exemplo, as primeiras sessões em que P6 atingiu a estabilidade foram as sessões 9, 10,11 e 12 (ver Figura 3), o segundo bloco foi composto pelas sessões 13, 14, 15 e 16 e sobraram sete sessões para serem analisadas. Como o último bloco deveria ser composto de no mínimo quatro sessões, este último bloco (Bloco 3) de P6 consistiu da média das taxas de respostas de sete sessões (17 a 23).

A proporção da mudança foi calculada dividindo-se a média das taxas de respostas de cada bloco pela média das taxas de respostas do Bloco 1. Portanto, cada 0,1 no eixo y representa 10% de variação na média das taxas de respostas, para mais ou para menos. Portanto, quanto mais distante um ponto está da linha tracejada horizontal, maior a variação na média da taxa de respostas de um determinado bloco em relação à média da taxa de respostas do Bloco 1.

Os resultados apresentados nas Figuras 7, 8, 9 e 10 indicam que no FR, os participantes não variaram muito a média da taxa de respostas após terem atingido o critério de estabilidade. No componente de DRL, para alguns participantes (P21, P7, P9, P13, P14, P19 e P20), a proporção de mudança em relação ao Bloco 1 foi maior quando comparada com a do componente de FR. No DRL, 5 de 20 participantes tiveram uma flutuação mais acentuada (acima de 0,5) entre os blocos de sessões. Por exemplo, para P21 a maior variação foi um acréscimo de 0,5 (no Bloco 5) – que representa 50% de variação em relação ao Bloco 1 –; para P7 a maior variação foi de 1,5 (no Bloco 2); para o P13 a maior variação foi de 0,9 (Bloco 3); para P14 foi de 1,2 (Bloco 2) e para o P20 de 2,2 (Bloco 4).

Apesar de, proporcionalmente, a variação ter sido alta no componente de DRL, a taxa de respostas absoluta não variou muito. Por exemplo, P21 aumentou a taxa de respostas em cerca de 1 ou 2 R/min das sessões do Bloco 1 para as sessões dos blocos subseqüentes. Como a taxa de respostas no DRL era muito baixa (2 R/min foi a média do Bloco 1), este aumento representou uma variação de cerca de 50% em relação aos demais blocos (a média da taxa de respostas nos Blocos 2 a 4 variou entre 2,75 a 3 R/min). Em outros casos, a variação nos blocos foi devida a aumentos abruptos e locais na taxa de respostas no DRL. A inspeção visual dos registros cumulativos de P20 indica bursts de respostas em certas partes do componente de DRL (semelhantes aos observados no registro cumulativo desse participante na Figura 6, letras a). Todavia, diferente do que pode sugerir a Figura 6, estes bursts não pareceram ter um padrão específico, uma vez que eles ocorreram ora no início, ora no meio, ora no final de um componente de DRL e ocorreram em qualquer uma das cinco apresentações do componente durante uma sessão, ao longo de todas as sessões.

 

Discussão

Os resultados do presente estudo sugerem que o procedimento de aquisição do comportamento de pressionar um botão em um programa de reforço múltiplo FR-DRL ao qual foram expostos os participantes do Grupo 3 foi o que produziu menor variabilidade entre participantes em relação à duração da fase de aquisição. Os resultados dos participantes dos Grupos 1 e 2 não diferiram substancialmente (um participante de cada grupo precisou mais do que as três sessões planejadas para completar a fase de aquisição do comportamento). Não houve diferenças estatisticamente significantes entre os grupos no tempo necessário para se completar a fase de aquisição do comportamento segundo os critérios do presente estudo.

O procedimento adotado para os participantes do Grupo 4, apesar de também ter produzido diferenciação entre os componentes de FR e DRL nas taxas de respostas logo no início das sessões da fase de aquisição, gerou o maior número de pontos obtidos por participante (uma vez que a mudança de componentes e o término da sessão não foram programados pelo número de pontos, como nos demais grupos). No caso de pesquisas que utilizem pontos trocados por dinheiro, como na presente pesquisa, esse procedimento acarretaria um gasto financeiro maior, além de uma diminuição gradual do montante de dinheiro recebido no decorrer das sessões (devido ao aumento nos parâmetros de cada programa de reforço), o que pode ter efeitos a médio ou longo prazo, como o abandono da pesquisa pelos participantes.

O fato de dois participantes do Grupo 4 terem repetido sessões deve ser interpretado com cautela, uma vez que o critério para se repetir uma sessão para esse grupo parece ter sido muito exigente. Talvez esse critério pudesse ser arranjado de forma a ser menos exigente, em torno de 50% dos pontos disponíveis no componente de DRL (ver o registro cumulativo de P20, Figura 6, no qual o participante obteve 53% dos pontos possíveis em DRL). Os participantes do Grupo 4 atingiram um índice de diferenciação das taxas de respostas próximo a 1 (ver Tabela 2), mesmo com a utilização do critério de tempo fixo para mudança de componente do múltiplo.

A diferença entre o procedimento de aquisição do comportamento dos participantes do Grupo 4 e dos demais grupos foi, principalmente, o critério para a mudança de componentes, que para os participantes do Grupo 4, era a passagem de um tempo fixo (independentemente do número de pontos ganhos). A adoção desse critério visava replicar os resultados de Hayes, Brownstein, Hass et al. (1986), Hayes, Brownstein, Zettle et al. (1986); Rosenfarb et al. (1992) e Wulfert et al. (1994) que utilizaram esse critério para a mudança dos componentes (i.e., esperava-se que alguns participantes desse grupo não atingissem a diferenciação na taxa de respostas). Apesar de dois participantes repetirem sessões (ver discussão acima) todos os participantes desse grupo completaram a fase de aquisição com um alto índice de diferenciação nas taxas de respostas. O fato da exposição aos parâmetros do programa de reforço múltiplo ter sido progressiva, em vez de direta, pode explicar parte dessa diferença. Os estudos citados, que utilizaram tempo fixo como critério para mudança de componente, expuseram os participantes diretamente ao valor esperado do programa de reforço (e.g., FR 40-DRL 8 s), enquanto que os participantes do Grupo 4, do presente estudo, foram expostos a um aumento progressivo nos parâmetros dos programas de reforço até chegarem ao valor final esperado (FR 60-DRL 20 s).

No estudo de Rumbold e White (1987) o critério para a mudança dos componentes em um múltiplo FR-DRL foi a passagem de um período fixo de tempo (5 minutos) e a diferenciação na taxa de respostas dos participantes foi obtida. Todavia, como para os participantes do Grupo 4 do presente experimento, os parâmetros da contingência de reforço aumentaram em duas sessões (iniciou, na primeira sessão, com FR 20-DRL 10 s e passou para FR 60-DRL 30 s, a partir da segunda sessão). A primeira sessão era mantida "até que o responder em cada componente ficasse sob controle das contingências especificadas" (p.187), mas não foi relatado quanto tempo isso demorou. No presente experimento, taxas mais altas no FR e mais baixas no DRL também foram obtidas desde a primeira sessão para os participantes do Grupo 4 (ver Tabela 2), embora essa diferença não fosse muito alta para alguns participantes. O ponto importante é que esses resultados parecem sugerir que o aumento progressivo nos parâmetros da contingência de reforço (ou, pelo menos, iniciá-lo em valores relativamente baixos) pode facilitar a diferenciação nas taxas de respostas em um múltiplo FR-DRL com humanos, mesmo quando a mudança dos componentes é feita pela passagem de um intervalo de tempo fixo, em vez de pela obtenção de certo número de "reforços".

Parece importante ressaltar que nem a mudança dos componentes por tempo fixo, nem a exposição direta aos parâmetros finais do programa de reforço múltiplo são condições que "impedem" a diferenciação na taxa de respostas no múltiplo FR-DRL com humanos. Como apontado anteriormente, no estudo de Wulfert et al. (1994) apenas três de 15 participantes não tiveram essa diferenciação. Nesse estudo, o critério de mudança dos componentes era de tempo fixo e os participantes eram expostos diretamente aos parâmetros finais do programa de reforço múltiplo. Mesmo assim, os estudos revisados (e.g., Costa et al., submetido; Okouchi, 1996, 1999, 2002 e Soares, 2008) em que o componente do múltiplo era alternado após um número de pontos obtidos e que utilizaram exposição progressiva aos parâmetros do múltiplo obtiveram diferenciação na taxa de respostas do múltiplo FR-DRL para todos os participantes.

Além da mudança dos componentes por tempo fixo vs.por pontos obtidos e da exposição direta vs.progressiva aos parâmetros finais do programa de reforço múltiplo, outras diferenças no procedimento também podem ser relevantes. A complexidade da tarefa experimental pode ser um importante fator do procedimento que contribui para essa diferença. No presente estudo e nos estudos revistos (Costa et al., submetido; Okouchi, 1996; 1999; 2002 e Soares, 2008) em que foi observada diferenciação na taxa de respostas em cada componente do múltiplo FR-DRL para todos os participantes, a tarefa experimental consistiu em pressionar um botão e receber pontos (após a emissão de uma resposta de consumação). Nos estudos em que não foi observada diferenciação na taxa de respostas em cada componente do múltiplo FR-DRL para a maioria dos participantes (Hayes, Brownstein, Hass et al., 1986; Hayes, Brownstein, Zettle et al., 1986 e Rosenfarb et al., 1992), a tarefa experimental era mais complexa. Os participantes operavam um equipamento que consistia em uma matriz 5x5 com dois botões; a sessão iniciava com uma luz branca no canto superior esquerdo da matriz. Se a contingência de reforço programada era cumprida no botão da direita, a luz "moviase" para a direita na matriz; se a contingência de reforço programada era cumprida no botão da esquerda, a luz "movia-se" para baixo na matriz. Quando o participante movia a luz do canto superior esquerdo até o canto inferior direito e emitia uma resposta de consumação, um ponto era acrescentado a um contador. Ou seja, o participante precisava cumprir a contingência oito vezes para receber um ponto. Entretanto, se o participante cumprisse a contingência mais de quatro vezes, utilizando o mesmo botão (direito ou esquerdo), antes da luz "chegar" ao canto inferior direito, a atividade era reiniciada (i.e., a luz voltava novamente para o canto superior esquerdo). É possível que, em conjunto com a mudança de componentes por tempo fixo, a complexidade dessa tarefa, que envolvia mover a luz e receber pontos somente quando ela chegasse a um "destino" especificado, além da possibilidade do reinício desses movimentos, caso o participante cumprisse a contingência mais de quatro vezes em um mesmo botão tenham contribuído para a não diferenciação da taxa de respostas nos componentes de FR e DRL da maioria dos participantes.

O estudo de Wulfert et al. (1994) também utilizou uma tarefa que foi mais complexa que a do presente estudo, porém menos complexa que o procedimento de "mover a luz" por uma matriz 5x5. A interface com a qual os participantes interagiam consistia de um retângulo composto por cinco quadrados, nos quais os participantes precisariam "mover uma luz" da esquerda para a direita. Cada vez que a contingência de reforço fosse cumprida, a luz movia um quadrado para a direita e, para receber um ponto, os participantes deveriam mover a luz da esquerda para a direita até o último quadrado à direita da tela. Ou seja, para que um ponto fosse creditado ao contador, a contingência precisava ser cumprida por quatro vezes consecutivas e em nenhum caso a tarefa era reiniciada sem o ganho de pontos. Com essa tarefa menos complexa, apenas três de 15 participantes não apresentaram diferenciação na taxa de respostas entre componentes do múltiplo FRDRL. Esses resultados em conjunto sugerem que a complexidade da tarefa pode ser uma variável importante na diferenciação das taxas de respostas.

Se, por um lado, alguns fatores do procedimento experimental podem estar relacionados com a diferenciação das taxas de respostas em um programa de reforço múltiplo, outras diferenças em alguns desses fatores podem ser irrelevantes na obtenção ou não dessa diferenciação. Um destes fatores parece ser a utilização de um período de time-out entre os componentes do múltiplo. O fato de os estudos de Costa et al. (submetido) e Rumbold e White (1987) também não terem utilizado o time-out e os participantes terem apresentado diferenciação nas taxas de respostas sugere que esta variável parece não ser determinante na seleção de taxas de respostas diferentes em um múltiplo FR-DRL. Outro fator foi a conseqüência programada. Apesar dos resultados de alguns estudos sugerirem que o evento conseqüente programado para o comportamento exerça algum efeito sobre o desempenho em programas de reforço (e.g., Costa et al., 2005; Costa et al., 2008; de Freitas, 2009; Salgado et al. submetido; Weiner, 1972) essa variável parece não influenciar a diferenciação da taxa de respostas em programas de reforço múltiplo. Tanto estudos que utilizaram somente pontos como evento conseqüente (Costa et al., submetido) como estudos que utilizaram pontos trocados por dinheiro (o presente estudo e os estudos de Okouchi, 1996; 1999; 2002 e o de Soares, 2008) apresentaram a diferenciação esperada nas taxas de respostas. Alguns participantes também não apresentaram diferenciação nas taxas de respostas com eventos conseqüentes diferentes, como créditos em cursos extracurriculares (e.g., Hayes, Brownstein, Hass, et al., 1986; Rosenfarb, et al., 1992; Wulfert, et al., 1994), prêmios em dinheiro, apenas, sorteados ao final do experimento (e.g., Hayes, Brownstein, Hass, et al.,; Hayes, Brownstein, Zettle, et al., 1986; Wulfert, et al.), ou combinados com outros eventos consequentes.

Quanto à estabilidade das taxas de respostas, os resultados sugerem que, sem levar em conta as sessões da fase de aquisição do comportamento, após nove sessões de exposição no múltiplo FR 60-DRL 20 s, todos os participantes atingiram o critério de estabilidade da taxa de respostas em ambos os componentes do múltiplo e mantiveram a diferenciação na taxa de respostas até o final da 20ª sessão de exposição ao múltiplo. Considerando-se a fase de aquisição, foram necessárias 12 sessões para que todos os participantes atingissem a estabilidade da taxa de respostas. A história de aquisição do comportamento não exerceu influência no tempo necessário para se atingir o critério de estabilidade das taxas de respostas, uma vez que os participantes não apresentaram variabilidade significativa em relação ao número de sessões necessárias para que os participantes atingissem o critério de estabilidade.

O fato de que, no presente estudo, a história de aquisição do comportamento não tenha afetado o tempo necessário para se atingir o critério de estabilidade adotado não significa que esta história de aquisição não poderia afetar o comportamento de alguma maneira em condições subseqüentes. Um estudo que sugere esta possibilidade foi o de Terrace (1963), que expôs dois pombos a um procedimento de discriminação "tradicional" e mais dois pombos a um procedimento de discriminação "sem erros". Ao final dessa fase de história, os pombos dos dois grupos tinham um desempenho muito semelhante (i.e., taxas de respostas muito mais altas frente ao S+ e taxas baixas ou nenhuma resposta na presença do S-). Após a fase de história, os sujeitos foram expostos a uma fase de administração de drogas (imipramina e clorpromazina) em diferentes doses. Com a administração das drogas, os sujeitos com história de discriminação "tradicional" responderam em taxas mais altas na presença do estímulo que anteriormente não foi correlacionado com o reforço (S-), enquanto os sujeitos com história de discriminação "sem erro" não responderam em S-.

Os resultados do experimento de Terrace (1963) sugerem que a história de aquisição de um operante discriminado pode não aparecer no comportamento presente, mas após a manipulação de alguma variável pode-se observar a influência da história no comportamento dos organismos. Como a presente pesquisa não manipulou nenhuma variável depois de atingido o múltiplo FR 60-DRL 20 s, não é possível afirmar se o comportamento poderia ser afetado por uma história de aquisição do comportamento em uma condição subseqüente. Futuras pesquisas poderiam testar o efeito da história de aquisição sobre a resistência à mudança (ou persistência comportamental), alterando a contingência de reforço de um múltiplo FR-DRL para um múltiplo FI-FI (cf. Freeman & Lattal, 1992; Costa et al. submetido; Soares, 2008) ou para um múltiplo Extinção-Extinção (cf. Nevin, 1974; Lattal, 1989).

O critério de Schoenfeld et al. (1956), que foi utilizado para avaliar a estabilidade da taxa de respostas no componente de FR, apresenta algumas limitações. Como este critério compara a média de dois sub-blocos, algumas vezes, o critério considera que um determinado bloco de sessões está estável quando há alguma variação entre as sessões ("encobertas" pela média) − como no caso da taxa de respostas no componente de FR quando o P4 e o P19 atingiram estabilidade (ver Figuras 2 e 5). Apesar das limitações, esse critério parece ser aceitável, pois permitiu prever o comportamento futuro, já que as taxas de respostas mantiveram-se nos mesmos níveis após o comportamento atingir estabilidade.

A previsão do comportamento futuro, na presente pesquisa, foi melhor no componente de FR do que no componente de DRL, pois, depois de terem atingido a estabilidade em ambos os componentes, as taxas de respostas dos participantes no componente de DRL mudaram mais quando comparado com a mudança nas taxas de respostas desses participantes no componente de FR: 5 de 20 participantes (P21, P7, P13, P14 e P20) apresentaram uma flutuação entre blocos de sessões no DRL que deve ser levada em consideração (ver Figuras 7, 8, 9 e 10). Todavia, deve-se levar em conta que, como apontado anteriormente, apesar da variação ter sido proporcionalmente alta no componente de DRL, a taxa de respostas absoluta ou não variou muito (1 a 2 R/min) ou variou devido a aumentos abruptos e locais na taxa de respostas no DRL. Alguns participantes desse estudo emitiram respostas chamadas de "respostas colaterais" (i.e., respostas que não eram necessárias para que a contingência fosse cumprida, mas "preenchiam" o tempo necessário para que a contingência de DRL fosse cumprida). Os resultados do experimento de Bruner e Revusky (1961) sugerem que o programa de reforço de DRL produz respostas colaterais durante o período em que o participante precisa esperar antes de emitir uma resposta que produza a liberação do "reforço". Na presente pesquisa, observações informais mostraram que alguns participantes também emitiam "respostas colaterais" e que a localização dessas respostas na tela foi diferente entre participantes.

Alguns clicavam no botão de resposta de consumação, outros no visor de pontuação e outros acima do botão de respostas. Entre os que clicavam acima do botão de respostas, estavam alguns dos participantes que apresentaram grandes variações na taxa de respostas no componente de DRL. Esses participantes clicavam acima do botão de respostas, por um número determinado de vezes, geralmente em altas taxas, antes de clicar no botão de respostas novamente (e.g., P7 e P14). Observações assistemáticas permitiram ver que, algumas vezes, os participantes que clicavam com o cursor acima do botão de respostas acabavam por movimentar o mouse, o que posicionava o cursor em cima do botão de respostas e, então, respostas eram registradas (zerando o intervalo do DRL). Talvez, os episódios durante os quais a emissão de respostas colaterais acidentalmente acionava o botão de respostas foram responsáveis por alguns dos aumentos abruptos nas taxas de respostas no componente de DRL para alguns participantes. Uma modificação do software ou até a filmagem da sessão experimental que permitisse o registro dos cliques fora do botão de respostas, talvez permitisse analisar se estas "respostas colaterais" estariam interferindo na estabilidade do comportamento estudado.

Uma questão que parece importante diz respeito aos diferentes critérios para a avaliação da estabilidade entre os componentes, que foi justificada pelas baixas taxas de respostas no componente de DRL. No componente de FR foi utilizado o critério de Schoenfeld et al. (1956) e no componente de DRL foi utilizado um critério absoluto de uma variação máxima três respostas por minuto sem que houvesse tendência nas taxas de respostas. Rumbold e White (1987) também notaram a dificuldade em se adotar um critério relativo nas taxas de respostas no componente de DRL de um programa de reforço múltiplo FR-DRL e optaram por adotar o critério de estabilidade no DRL baseado nas taxas de reforço em vez das taxas de respostas dos participantes. Adotar um critério baseado na taxa de reforço pode ser uma alternativa ao uso do critério absoluto quando se pretende utilizar o mesmo critério para programas de reforço que geram altas e baixas taxas de respostas. Porém, utilizar um critério de estabilidade baseado na taxa de reforço não parece apresentar vantagem quando a variável dependente de um dado estudo é a taxa de respostas, pois nada garante que quando a taxa de reforço estiver estável, a taxa de respostas também estará.

No presente estudo, foi realizado o cálculo da estabilidade, utilizando um critério de estabilidade para o componente de DRL baseado na taxa de reforço, não apresentado nos resultados. Verificou-se, como previsto, que alguns participantes variaram a taxa de respostas e não variaram a taxa de reforços e outros variaram a taxa de reforço e não variaram a taxa de respostas. Apesar de o cálculo da estabilidade da taxa de reforço apresentar uma variação menor nos dados, essa variação menor apenas encobria as variações nas taxas de respostas (que era a medida de interesse no presente estudo) e, por isso, esses cálculos não foram exibidos e optou-se por não utilizá-lo no presente estudo.

Os resultados das pesquisas sobre momento comportamental de Nevin (1974) e Lattal (1989), que utilizaram pombos como sujeitos, sugerem que altas taxas de respostas mudam mais quando comparadas com baixas taxas de respostas. Os resultados da presente pesquisa apontam para uma direção diferente, sugerindo que baixas taxas de respostas são menos resistentes à mudança (componente de DRL) do que altas taxas de respostas (componente de FR). Entretanto, as pesquisas sobre momento comportamental utilizam algum evento "perturbador" (disrupting event), como uma fase de extinção, punição ou liberação da comida independente da resposta, para avaliar a resistência à mudança. Diferentemente dessas pesquisas, a presente pesquisa não realizou qualquer manipulação experimental semelhante. As mudanças nas taxas de respostas foram avaliadas após um critério de estabilidade ter sido atingido ao longo das sessões de exposição. No experimento de Soares (2008) com humanos, a contingência foi alterada de um múltiplo FR-DRL para um múltiplo FI-FI e os resultados foram semelhantes ao do presente estudo. O componente em que as taxas de respostas mudaram mais foi o de baixas taxas (o componente de FI na presença do estímulo anteriormente presente durante o DRL). Talvez, avaliar a mudança na taxa de respostas ao longo do tempo ou avaliar a mudança na taxa de respostas após a mudança de contingência para um múltiplo FI-FI tenha um efeito diferente do que a introdução de um evento perturbador como aqueles comumente utilizados nos estudos de momento comportamental. Nesse sentido, se além de testar o efeito da história de aquisição sobre a resistência à mudança (ou persistência comportamental) – conforme sugerido anteriormente –, houver interesse em testar se componentes com baixas taxas de respostas seriam mais resistentes à mudança do que componentes com alta taxa de respostas, talvez seja mais interessante mudar a contingência de reforço de um múltiplo FR-DRL para um múltiplo Extinção-Extinção.

Em resumo, os resultados do presente estudo sugerem que a diferenciação nas taxas de respostas em um programa de reforço múltiplo FR-DRL pode ser atingida após diferentes histórias de aquisição. Apesar das diferenças entre os grupos não ter influenciado a diferenciação na taxa de respostas do programa de reforço múltiplo, alguma atenção pode ser dada ao fato de que houve menor variabilidade intra-grupo dos participantes do Grupo 3 (história de aquisição do múltiplo FR-DRL em que os componentes se alternavam após um número fixo de pontos ganhos e o parâmetro dos programas de reforço eram aumentados entre sessões) e maior quantidade de pontos obtidos por sessão pelo Grupo 4 (história de aquisição do múltiplo FR-DRL em que os componentes se alternavam após a passagem de um período de tempo fixo e o parâmetro dos programas de reforço eram aumentados entre sessões), para que a aquisição do comportamento fosse considerada atingida. Os resultados sugerem também que a o procedimento específico adotado na história de aquisição do comportamento parece não influenciar o número de sessões necessárias para que os participantes atinjam um critério de estabilidade nas taxas de respostas em um múltiplo FR-DRL, nem a manutenção da estabilidade da taxa de respostas com a exposição continuada ao programa de reforço e que após nove sessões de exposição ao programa múltiplo (depois de completada a fase de aquisição) todos os participantes atingem o critério de estabilidade adotado no presente estudo.

 

Referencias

Baron, A., & Perone, M. (1998). Experimental design and analysis in the laboratory study of human operant behavior. Em K. A. Lattal, & M. Perone (Eds.), Handbook of research methods in human operant behavior (pp. 45–91). New York: Plenum.

Bernstein, D. J. (1988). Laboratory lore and research practices in the experimental analysis of human behavior: designing sessions logistics-how long, how often and how many? The Behavior Analyst, 11, 51-58.         [ Links ]

Boren, J. J., & Navarro, A. P. (1959). The action of atropine, Benactyzine and Scopolamine upon fixedinterval and fixed-ratio behavior. Journal of the Experimental Analysis of Behavior, 2(2), 107-115.         [ Links ]

Bruner, A., & Revusky, S. H. (1961). Collateral behavior in humans. Journal of the Experimental Analysis of Behavior, 4, 349-350.         [ Links ]

Buskist, W. F., Miller, H. L. Jr., & Bennett, R. H. (1980). Fixed-interval performance in humans: Sensitivity to temporal parameters when food is the reinforcer. The Psychological Record, 30, 111-121.         [ Links ]

Catania, A. C. (1998). Learning. 4th Ed. New Jersey: Prentice Hall.         [ Links ] Costa, C. E., & Banaco, R. A. (2002). ProgRef v3: sistema computadorizado para a coleta de dados sobre programas de reforço com humanos – recursos básicos. Revista Brasileira de Terapia Comportamental e Cognitiva, 4, 171-172.

Costa, C. E., & Banaco, R. A. (2003). ProgRef v3: sistema computadorizado para a coleta de dados sobre programas de reforço com humanos – recursos adicionais. Revista Brasileira de Terapia Comportamental e Cognitiva, 5, 219-229.

Costa, C. E., Banaco, R. A., & Becker, R. M. (2005). Desempenho em FI com humanos: efeito do tipo de reforçador. Temas em Psicologia da SBP, 13, 14-29.         [ Links ]

Costa, C. E., Banaco, R. A., Longarezi, D. M., Maciel, E. M., & Sudo, C. H. (2008). Tipo de reforçador como variável modeladora dos efeitos da história em humanos. Psicologia Teoria e Pesquisa, 24(2), 251-262.         [ Links ]

Costa, C. E., Patsko, C. H., & Becker, R. M. (2007). Desempenho em FI com Humanos: Efeito da Interação da Resposta de Consumação e do Tipo de Instrução. Interação em Psicologia, 11(2), 175-186.         [ Links ]

Costa, C. E. Soares, P. G., & Ramos, M. N. (submetido). Controle de estímulos e história comportamental: uma replicação sistemática de Freeman e Lattal (1992). Temas em Psicologia da SBP.         [ Links ]

Cumming, W. W., & Schoenfeld, W. N. (1960). Behavior stability under extended exposure to a time-correlated reinforcement contingency. Journal of the Experimental Analysis of Behavior, 3, 71-82.         [ Links ]

De Freitas, L. A. B. (2009). O efeito da consequência programada sobre a estabilidade da taxa de respostas em FI. Dissertação (Mestrado em Análise do Comportamento). Universidade Estadual de Londrina, Londrina.         [ Links ]

Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. Massachusetts: Copley Publishing Group.         [ Links ]

Freeman, T. J., & Lattal, K. A. (1992). Stimulus control of behavioral history. Journal of the Experimental Analysis of Behavior, 57, 5-15.         [ Links ]

Hayes, S. C. (1987a). Upward and downward continuity: It's time to change our strategic assumptions. Behavior Analysis, 22(1), 3-6.         [ Links ]

Hayes, S. C. (1987b). Language and the incompatibility of evolutionary and psychological continuity. Behavior Analysis, 22(2), 49-54.         [ Links ]

Hayes, S. C., Brownstein, A. J., Haas, J. R., & Greenway, D. E. (1986). Instructions, multiple schedules, and extinction: Distinguishing rule-governed from schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147.         [ Links ]

Hayes, S. C., Brownstein, A. J., Zettle, R. D., Rosenfarb, I., & Korn, Z. (1986). Rule-governed behavior and sensitivity to changing consequences of responding. Journal of the Experimental Analysis of Behavior, 45, 237-256.         [ Links ]

Horne, P. J., & Lowe, C. F. (1993). Determinants of human performance on concurrent schedules. Journal of the Experimental Analysis of Behavior, 59, 29-60.         [ Links ]

Johnston, J. M., & Pennypacker, H. S. (1993). Strategies and tatics of behavioral research. (2a ed.). Hillsdale, NJ: Lawrence Erlbaum Associates, Inc.         [ Links ]

Joyce, J. H., & Chase, P. N. (1990). Effects of response variability on the sensitivity of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 54, 251-262.         [ Links ]

Kazdin, A. E. (1982). Single-case research designs: methods for clinical and applied settings. New York: Oxford University Press.         [ Links ]

Knutson, J. F. (1970). Aggression during the fixed-ratio and extinction components of a multiple schedule of reinforcement. Journal of the Experimental Analysis of Behavior, 13, 221-231.         [ Links ]

Lattal, K. A. (1989). Contingencies on response rate and resistance to change. Learning and Motivation, 20, 191-203.         [ Links ]

Lowe, C. F. (1979). Determinants of human operant behavior. Em M. D. Zeiler, & P. Harzem (Orgs.), Advances in analysis of behavior: Reinforcement and the organization of behavior (Vol.1; pp. 159-192).         [ Links ]

Chichester: Wiley, & Sons. Madden, G. J., Chase, P. N., & Joyce, J. H. (1998). Making sense of sensitivity in the human operant literature. Behavior Analyst, 21(1), 1-12.         [ Links ]

Matthews, B. A., Shimoff, E., Catania, A. C., & Sagvolden, T. (1977). Uninstructed human responding: Sensitivity to ratio and interval contingencies. Journal of the Experimental Analysis of Behavior, 27, 453-467.         [ Links ]

Morris, E. K., Johnson, L. M., Todd, J. T., & Higgins, S. T. (1988). Laboratory lore and research practices in the experimental analysis of human behavior: Subject selection. Behavior Analyst, 11(1), 43-50.         [ Links ]

Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the Experimental Analysis of Behavior, 21, 389-408.         [ Links ]

Okouchi, H. (1996). Stimulus control of schedule history effects. Influence of instructions and discriminative schedule control. Japanese Journal of Behavior Analysis, 10, 118-129.         [ Links ]

Okouchi, H. (1999). Instructions as discriminative stimuli. Journal of the Experimental Analysis of Behavior, 72, 205-214.         [ Links ]

Okouchi, H. (2002). Instructions as discriminative stimuli (2): A within subject examination of the effect of differential reinforcement on establishing novel instructional control. Japanese Psychological Research, 44(4), 234-240.         [ Links ]

Okouchi, H. (2003). Effects of differences in interreinforcer intervals between past and current schedules on fixed-interval responding. Journal of the Experimental Analysis of Behavior, 79, 40-64.         [ Links ]

Perone, M. (1991). Experimental design in the analysis of free-operant behavior. Em I. H. Iversen, & K. A. Lattal (Orgs.), Experimental analysis of behavior - Part I (pp. 59-85). New York: Elsevier.         [ Links ]

Perone, M., Galizio, M., & Baron, A. (1988). The relevance of animal-based principles in the laboratory study of human operant conditioning. Em G. Davey, & C. Cullen (Orgs.), Human operant conditioning and behavior modification (pp. 59-85). New York: Wiley, & Sons.         [ Links ]

Pilgrim, C., & Johnston, J. M. (1988). Laboratory lore and research practices in the experimental analysis of human behavior: Issues in instructing subjects. The Behavior Analyst, 11, 59-64.         [ Links ]

Raia, C. P., Shillingford, S. W., Miller Jr., H. L., & Baier, P. S. (2000). Interaction of procedural factors in human performance on yoked schedules. Journal of the Experimental Analysis of Behavior, 74(3), 265-281.         [ Links ]

Rosenfarb, I. S., Newland, M. C., Brannon, S. E., & Howey, D. S. (1992). Effects of self-generated rules on the development of schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 58, 107-121.         [ Links ]

Rumbold, G.R., & White, J.M. (1987). Effects of repeated alcohol administration on human operant behaviour. Psychopharmacology, 92, 186-191.         [ Links ]

Salgado, R. C., Cançado, C. R. X., & Costa, C. E. (no prelo). Efeitos do reforçador empregado em história de reforço recente e remota. Psicologia: Teoria e Pesquisa.         [ Links ]

Schoenfeld, W. N., Cumming, W. W., & Hearst, E. (1956). On the classification of reinforcement schedules. Proceedings of the National Academy of Sciences of the United States of America, 42, 563-570.         [ Links ]

Shull, R. L., & Lawrence, P. S. (1998). Reinforcement: schedule performance. Em K. A. Lattal, & M. Perone (Eds.), Handbook of research methods in human operant behavior (pp. 95–129). New York: Plenum.

Sidman, M. (1960). Tactics of scientific research. New York: Basic Books.         [ Links ]

Soares, P. G. (2008). Controle de Estímulos e História Comportamental em Humanos. Dissertação apresentada ao Programa de Mestrado em Análise do Comportamento da Universidade Estadual de Londrina.         [ Links ]

Terrace, H. S. (1963). Errorless discrimination learning in the pigeon: Effects of chlorpromazine and imipramine. Science, 340, 318-319.         [ Links ]

Wanchisen, B. A. (1990). Forgetting lessons of history. The Behavior Analyst, 13, 31-37.         [ Links ]

Wanchisen, B. A., & Tatham, T. A. (1991). Behavioral history: A promising challenge in explaining and controlling human operant behavior. The Behavior Analyst, 14, 139-144.         [ Links ]

Wanchisen, B. A., Tatham, T. A., & Mooney, S. E. (1989). Variable-ratio conditioning history produces highand low-rate fixed-interval performance in rats. Journal of the Experimental Analysis of Behavior, 52, 167-179.         [ Links ]

Weiner, H. (1969). Controlling human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 12, 349-373.         [ Links ]

Weiner, H. (1970). Human behavioral persistence. The Psychological Record, 20, 445-456.         [ Links ]

Weiner, H. (1972). Human fixed-ratio responding as a function of the type of reinforcer (money vs. points) and the presence or absence of a noncontingent monetary wage. The Psychological Record, 21, 497- 500.         [ Links ]

Weiner, H. (1983). Some thoughts on discrepant human-animal performances under schedules of reinforcement. The Psychological Record, 83, 521-532.         [ Links ]

Wulfert, E., Greenway, D. E., Farkas, P., Hayes, S. C., & Dougher, M. J. (1994). Correlation between selfreported rigidity and rule-governed insensitivity to operant contingencies. Journal of Applied Behavior Analysis, 27, 659-671.         [ Links ]

 

 

Received: July 30, 2010;
Accepted: February 11, 2011

 

 

* Mestre em Análise do Comportamento pela Universidade Estadual de Londrina.
** Graduado em Psicologia na Universidade Estadual de Londrina, aluno do programa de mestrado em Análise do Comportamento pela Universidade Estadual de Londrina.
*** Doutor em Psicologia Experimental pela Universidade de São Paulo e Professor da Universidade Estadual de Londrina. Este artigo é derivado da dissertação do primeiro autor, sob orientação do último autor, apresentada em 2009 no programa de mestrado em Análise do Comportamento da Universidade Estadual de Londrina. Os autores agradecem a colaboração de Carlos Renato Xavier Cançado pela leitura cuidadosa da primeira versão deste artigo e suas sugestões.
1) Os resultados destes estudos referem-se apenas aos dos grupos que recebiam instruções mínimas (condição semelhante ao do presente estudo). Isso foi feito para facilitar a comparação dos resultados daqueles estudos citados e o presente estudo. Porém, cada um dos estudos citados possuía outros grupos de participantes em outras condições experimentais (com diferentes tipos e detalhes de instruções).
2) Os critérios de diferenciação da taxa de respostas no múltiplo FR-DRL foram diferentes entre os estudos. No estudo de Hayes, Brownstein, Zettle et al. (1986) a análise foi visual; no estudo de Hayes, Brownstein, Haas, et al. (1986) e de Rosenfarb et al. (1992) foi um critério quantitativo semelhante ao utilizado no presente estudo (descrito no Método, na subseção Procedimento) e, finalmente, no de Wulfert et al. (1994) não deixa claro os critérios, apenas cita que três participantes (de um total de 12) não conseguiram a diferenciação esperada e foram descartados da pesquisa, sendo substituídos por outros três participantes que atingiram a diferenciação (portanto, 3 de 15 participantes não atingiram a diferenciação esperada na taxa de respostas). Wulfert et al. exibem apenas os dados dos que atingiram, segundo eles, tal diferenciação.
3) As sequências específicas, adotadas no presente trabalho estão descritas na seção de "Métodos".
4) O presente projeto foi avaliado e aprovado pelo Comitê de Ética em Pesquisas Envolvendo Seres Humanos da Universidade Estadual de Londrina (Parecer nº 282/07).
5) O termo "parâmetro", quando empregado no contexto da descrição dos programas de reforço, se refere à exigência do referido programa de reforço para a liberação do evento consequente programado. Por exemplo, em um múltiplo FR 60-DRL 20 s, o parâmetro do FR é a razão especificada (60 respostas) e o parâmetro do DRL refere-se ao intervalo de tempo mínimo entre respostas (20 segundos).

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License