Efeitos da exposição a atividades sobre respostas de pressão à barra em esquema temporal de reforçamento

Aureliano, Lívia Ferreira Godinho; Banaco, Roberto Alves

Serviços Personalizados

artigo

Tradução automática

Indicadores

Acessos

Mais
Mais

Permalink

Psicologia: teoria e prática

versão impressa ISSN 1516-3687

Psicol. teor. prat. vol.16 no.2 São Paulo ago. 2014

DESENVOLVIMENTO HUMANO

Efeitos da exposição a atividades sobre respostas de pressão à barra em esquema temporal de reforçamento^I

Effects of exposure to activities under lever press responses in temporal schedule of reinforcement

Efectos de la exposición a actividades sobre respuestas de presión a la barra en esquemas temporales de refuerzo

Lívia Ferreira Godinho Aureliano^II; Roberto Alves Banaco^II
^IA dissertação de mestrado da primeira autora, que deu origem ao artigo, foi parcialmente financiada pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes)
^II Pontifícia Universidade Católica de São Paulo, São Paulo – SP – Brasil

Endereço para correspondência

Resumo

Foram investigados os efeitos do acesso e o tempo de exposição às atividades sem reforço programado sobre a efetividade das respostas de pressão à barra submetidas a esquemas de reforçamento diferencial de baixas taxas (DRL 5, 10 e 21 segundos). Foram sujeitos quatro ratos machos, privados de alimento: dois submetidos a uma caixa experimental com sete compartimentos, e dois, à caixa operante padrão. As maiores diferenças entre os desempenhos ocorreram a partir do DRL 10 s. No DRL 21 s, as taxas de reforços obtidos foram maiores para os sujeitos da caixa padrão, sem acesso a atividades. As porcentagens de respostas reforçadas aumentaram em função do tempo da sessão para os quatro sujeitos, sem diferenças expressivas. Concluiu–se que o acesso às atividades não exerceu função essencial para a efetividade das respostas submetidas ao DRL e que talvez a variável crítica tenha sido o tempo de exposição dos sujeitos aos valores dos esquemas e não o acesso a outras atividades.

Palavras–chave: ambiente aberto e fechado; atividades colaterais; esquema temporal de reforçamento; reforçamento diferencial de baixa taxa (DRL); efetividade do desempenho

Abstract

The effects of accessibility and duration exposure to activities without programmed reinforcers on lever pressing responses under a differential reinforcement of low rates were investigated (DRL 5, 10 and 21 seconds). Subjects were four male food deprived rats submitted to two chambers: a standard operant chamber and a seven compartment chamber. The main differences between results were achieved when DRL 10s or higher was in effect. In DRL 21s, reinforcers rates of subjects in standard chambers were higher than others two subjects. Reinforced responses percentage increased with time session for all subjects. Conclusions suggest that there are not essential role of availability of other activities under effectiveness performance on DRL and the main variable has been the subject's exposure time under the DRL values nor activities access.

Keywords: open and closed environments; collateral behavior; temporal schedules of reinforcement; differential reinforcement of low rate (DRL); performance effectively

Resumen

Fueron estudiados los efectos del acceso y el tiempo de exposición a actividades sobre respuestas de presión a la barra sometido a un esquema temporal de reforzamiento diferencial de tasas bajas (DRL 5, 10 e 21 segundos). Los sujetos fueron cuatro ratos machos, privados de alimento: dos de ellos sometidos a una caja experimental con siete compartimentos y los demás a una caja operante estándar. Las diferencias mayores en relación al desempeño se presentaron a partir del DRL 10 s. En DRL 21 s, las tasas de los refuerzos obtenidos fueron mayores para los sujetos de la caja estándar. Los porcentajes de respuestas reforzadas aumentaron como una función de tiempo de la sesión para los cuatro sujetos, sin diferencias significativas. Se concluyó que las actividades no tuvieron una función esencial en la eficacia de las respuestas presentadas delante el DRL y tal vez la variable crítica haya sido el momento de la exposición de los sujetos a los valores de los esquemas y no el acceso a otras actividades.

Palabras clave: ambiente abierto y cerrado; comportamiento colateral; esquema temporal de reforzamiento; reforzamiento diferencial de tasas bajas; efectividad del desempeño

Uma das variáveis que determinam a forma como as pessoas se comportam é a passagem do tempo. Esperar poucos minutos para ter acesso a reforçadores ou aguardar muitas horas parece afetar de maneiras distintas o comportamento de um indivíduo, além da acessibilidade a outras atividades durante o intervalo entre a resposta e a liberação do reforçador. Essa questão sobre o controle temporal do comportamento é objeto de investigação há algum tempo, e Skinner é apontado como um dos precursores desses estudos na área da análise do comportamento (Lejeune, Richelle, & Wearden, 2006). Segundo Lejeune et al. (2006), já em 1938, em seu livro Behavior of organisms, Skinner afirma que o tempo não pode ser considerado como uma simples dimensão do estímulo. Desde então, estudos foram realizados a fim de investigar de que maneira a passagem do tempo afeta o responder dos organismos. Lejeune et al. (2006) citam alguns desses estudos que investigaram os comportamentos colaterais, tanto como mediadores da passagem do tempo entre as respostas reforçadas quanto apenas como comportamentos que aparecem em esquemas de intervalo, como o estudo de Staddon e Simmelhag (1971), a partir do qual foi dado o nome de comportamento adjuntivo ou induzido pelo esquema aos comportamentos emitidos durante os intervalos entre as respostas reforçadas em intervalo fixo.

Alguns modelos comportamentais foram propostos para explicar o controle temporal do comportamento (Killeen & Fetterman, 1988; Machado, 1997). No entanto, para os objetivos deste estudo, foi considerada a literatura a respeito dos possíveis papéis dos comportamentos colaterais sobre a efetividade de respostas operantes em esquemas de intervalo, como o reforçamento diferencial de baixa taxa (DRL). Porém, os principais estudos nessa linha de investigação são antigos, com publicações que datam das décadas de 1960, 1970 e 1980, alguns deles tendo sido utilizados como base de discussão para este estudo. Mais recentemente, poucas pesquisas referentes a essa linha de investigação foram publicadas (Derenne & Baron, 2002; Escobar & Bruner, 2007) e, por terem poucas semelhanças metodológicas com este estudo, não foram consideradas na revisão de literatura aqui presente.

O presente estudo, portanto, juntamente com o estudo feito por Sales (2006), pretendeu resgatar algumas discussões que permaneceram em aberto, como os efeitos do acesso a atividades sobre respostas operantes de sujeitos submetidos a esquemas temporais de reforçamento.

Os esquemas de reforçamento diferencial da organização temporal (Catania, 1999) são muito estudados pelos analistas do comportamento, sejam como variáveis independentes ou como linha de base para a investigação de efeitos de uma série de outras variáveis independentes (Zeiler, 1984). Um desses esquemas é o DRL, que é definido pela liberação do reforço após a emissão de uma resposta que é precedida por um tempo mínimo sem nenhuma resposta emitida. As respostas que ocorrem durante esse intervalo, além de não serem reforçadas, reiniciam o tempo. Esse tempo entre as respostas é chamado de interresponse time (IRT). Assim, no caso do DRL, são reforçadas apenas as respostas emitidas após os IRTs maiores que o tempo requerido para reforçamento ou iguais a ele. Em geral, quanto mais longo é o IRT requerido, mais baixa é a taxa do responder (Catania, 1999).

Pelo fato de o esquema de DRL claramente especificar uma relação temporal entre dois eventos (Kramer & Rilling, 1970) e apresentar uma exigência maior para o reforçamento do que os esquemas de intervalo – intervalo fixo (fixed interval – FI) e intervalo variável (variable interval – VI) –, é o esquema mais utilizado nos estudos sobre os possíveis determinantes da efetividade do responder sob esquemas temporais.

Como já citado anteriormente, um desses determinantes investigados pela literatura é o que se refere às atividades nas quais os sujeitos se engajam durante o intervalo para a liberação do reforço. O estudo de Laties, Weiss, Clark e Reynolds (1965) teve como objetivo fazer uma análise detalhada de um exemplo particular de uma cadeia de comportamentos observáveis que emergiu durante o treino de um rato, privado de alimento, em um esquema múltiplo para a resposta de pressão à barra (razão fixa, extinção, DRL, extinção). O rato desenvolveu um padrão de morder a cauda durante a etapa do DRL. Os resultados obtidos mostraram que quanto maior a duração do contato da boca do animal com sua cauda, maior o percentual de respostas reforçadas. Os resultados em extinção demonstraram que a resposta de morder a cauda foi extinta mais rapidamente do que a resposta colocada em extinção (pressão à barra). Com a reintrodução do reforçador, o comportamento de morder a cauda voltou a ser emitido, e a taxa de respostas de pressão à barra retornou aos valores da condição anterior à extinção. Esse resultado sugeriu que a cadeia de respostas (morder a cauda e pressão à barra) estava sendo acidentalmente reforçada.

Em outro estudo, Laties, Weiss e Weiss (1969), com o objetivo de investigar se os comportamentos colaterais observáveis poderiam, acidentalmente, exercer um papel importante no controle e na determinação da distribuição de respostas em esquemas temporais, mostraram que, gradativamente, cada um dos sujeitos desenvolveu uma topografia de comportamentos colaterais (roer o chão de madeira, as barras da grade, morder o pedaço de madeira). Enquanto não ocorreu o desenvolvimento das respostas colaterais estereotipadas, o número de reforços obtidos foi pequeno (menos de 40 reforços obtidos ao longo das sessões, para 200 reforços possíveis por sessão), e, quando foi colocada uma oportunidade de emissão de respostas colaterais (pedaço de madeira), o número de reforços obtidos dobrou. Foi observado também que, quando retirada a oportunidade de emissão da resposta colateral (roer madeira), a taxa de respostas aumentou marcadamente e o número de respostas reforçadas diminuiu, até que outra resposta foi desenvolvida (morder a cauda) e a mesma efetividade das respostas de pressão à barra foi atingida. A partir dos resultados desses dois estudos, portanto, é possível identificar que fazer alguma coisa (morder a cauda, roer a madeira etc.) durante o intervalo entre a resposta e o reforço parece contribuir para um melhor desempenho dos sujeitos.

Outros estudos apontam para a função de interferência das atividades nas quais os sujeitos se engajam em relação ao desempenho, uma vez que tais atividades fazem com que os sujeitos permaneçam afastados do manipulando durante o tempo necessário para a emissão da resposta a ser reforçada.

McGown, Spencer e Neetz (1977) desenvolveram um experimento com o objetivo de investigar a influência da resposta de roer madeira em ratos na manutenção e aquisição do desempenho em DRL. Os autores concluíram que a presença da madeira teve a função de manter o rato afastado do manipulando nas primeiras sessões, e, nas últimas sessões, o controle efetivo do tempo para o reforçamento foi acompanhado da diminuição da atividade de roer a madeira. Os autores sugeriram, portanto, que o papel das atividades colaterais foi de interferência, uma vez que tais atividades fizeram com que os sujeitos permanecessem afastados da barra durante o tempo necessário para a emissão da resposta a ser reforçada. Além disso, apesar de apresentarem o papel de interferência, os autores consideraram que as atividades não foram essenciais para a aquisição ou até mesmo para a manutenção do desempenho em DRL, já que os sujeitos do grupo que não tiveram acesso à madeira na primeira fase também adquiriram o padrão temporal do responder operante e, mesmo com o acesso à madeira na segunda fase, não emitiram a resposta de roê–la. É possível identificar, portanto, que as atividades nas quais os sujeitos se engajam durante o intervalo para reforçamento em esquemas temporais como o DRL parecem ser importantes, porém não fundamentais, para a efetividade do comportamento.

McIntire, Lundervold, Calmes, Jones e Allard (1983) conduziram experimentos com o objetivo de avaliar as hipóteses trazidas por estudos anteriores sobre o papel das atividades no controle temporal do comportamento e também sobre as propriedades das cadeias das atividades chamadas de colaterais. O equipamento utilizado foi uma caixa com dez compartimentos, mais um localizado ao centro a partir do qual se tinha acesso a todos os outros. Cada um continha um tipo de objeto que possibilitava o engajamento a uma atividade específica (barra e comedouro, serragem, bebedouro, madeira, roda de atividade, papel, balanço, vazio, bolas de gude e gaiola com outro rato).

Em um dos experimentos, foi estudada a relação entre a resposta operante de pressão à barra em ratos e as atividades colaterais sob um esquema de DRL. Cada um dos sujeitos foi submetido a sessões durante as quais o acesso a qualquer compartimento estava liberado e a resposta de pressão à barra mantida sob um esquema DRL 28 s. Após a estabilidade do desempenho sob esse esquema, os quatro ratos passaram por sessões em condição fechada, isto é, o sujeito ficava restrito ao compartimento da barra e comedouro, também submetido ao esquema DRL 28 s. Os resultados indicaram que houve um aumento na taxa de repostas de pressão à barra durante a condição fechada, e essa taxa só diminuiu ao nível da condição aberta após treino extensivo (entre 43 e 56 sessões). Em outro experimento, os autores concluíram que, de maneira geral, a mudança no responder ocorreu apenas quando todos os compartimentos foram restritos. Dessa forma, segundo os autores, tal diferença nos resultados pareceu se dar em função da disponibilidade de estímulos alternativos nos outros compartimentos, independentemente de quais fossem e/ou da habilidade de sair do compartimento de comida, ou seja, afastar–se do manipulando. Além disso, os autores chegaram à mesma conclusão de McGown et al. (1977), ou seja, as atividades colaterais têm a função de afastar o sujeito do manipulando durante os IRTs, o que facilita a aquisição do padrão temporal exigido para reforçamento no DRL.

Um estudo mais recente, realizado por Sales (2006), investigou as possíveis relações entre o responder reforçado segundo dois esquemas de reforçamento (FI e DRL) e o engajamento dos sujeitos em atividades sem reforço programado. Uma das perguntas que direcionaram o trabalho foi se haveria diferenças de desempenho dos sujeitos entre os esquemas de FI e DRL, no caso de possibilidade de engajamento em outras atividades. Os resultados obtidos por Sales (2006) indicaram que houve diferença na taxa de respostas, no tempo entre reforçadores e na porcentagem de respostas reforçadas entre os sujeitos em condição fechada e aberta durante o esquema de DRL. Essas diferenças se acentuaram conforme ocorreu o aumento dos valores de DRL (9 s e 20 s). Os dados indicaram que talvez a condição aberta e o acesso a outros compartimentos tenham facilitado a aquisição do padrão de espaçamento entre respostas de pressão à barra exigido pelo esquema de DRL. Os resultados, a partir da inversão das condições de acesso, indicaram que as taxas de respostas e tempo entre reforçadores dos sujeitos que mudaram da condição aberta para a fechada aumentaram, enquanto a porcentagem de respostas reforçadas diminuiu. Já para os sujeitos que foram submetidos à inversão da condição, da fechada para a aberta, houve uma diminuição nas taxas de respostas e tempo entre reforçadores e um aumento na porcentagem de respostas reforçadas. Isso sugere que a mudança da condição aberta para a fechada prejudicou o desempenho dos sujeitos, tornando–o menos efetivo. Já a inversão de fechado para aberto melhorou o desempenho dos sujeitos, mas os resultados apontam também que tal melhora não perdurou por muito tempo, voltando os valores aos patamares da condição fechada.

A partir dos estudos aqui descritos, é possível identificar que a questão do controle do comportamento em esquemas com exigência temporal para reforçamento ainda está presente e é discutida de maneiras diferentes entre os autores da área. O objetivo deste estudo, portanto, foi investigar os efeitos da possibilidade de acesso e o tempo de exposição dos sujeitos às atividades para as quais não havia reforçadores programados sobre a efetividade do desempenho sob o esquema com exigência temporal para o reforçamento, neste caso, o DRL.

Método

Sujeitos

Foram utilizados neste experimento quatro ratos machos da linhagem Wistar, experimentalmente ingênuos, mantidos individualmente em gaiolas –viveiro. Três deles tinham 85 dias no início das pesagens e um iniciou com 188 dias. Os quatro foram submetidos a uma restrição alimentar até que o peso fosse mantido entre 80% e 85% do peso ad lib.

Equipamentos e materiais

Utilizaram–se duas caixas experimentais: uma caixa operante padrão (denominada neste estudo como caixa "padrão") contendo uma barra, um dispensador de alimento e um comedouro; e uma caixa experimental contendo sete compartimentos, a mesma utilizada por Sales (2006), que, neste trabalho, foi denominada caixa de atividades. Esta caixa era composta por: compartimento central (C1) com orifícios que permitiam o acesso aos compartimentos 2, 3, 4, 6 e 7; compartimento do comedouro (C2), onde foram montados o comedouro e a barra; compartimento da água (C3), localizado ao lado do C2, com uma garrafa de água acoplada à qual o rato teve acesso irrestrito; compartimento corredor (C4), que ligava o C1 e o C5; roda de atividades (C5), que foi equipada com um contador que registrou cada ¼ de volta na roda, em qualquer um dos sentidos; compartimento da madeira (C6), onde foi colocado um pedaço de madeira preso no compartimento por um arame; um compartimento vazio (C7).

A caixa operante padrão que foi utilizada esteve ligada a uma interface Med Associates Inc. e ao computador. Um programa controlou o esquema de reforçamento e seus valores, assim como registrou as respostas de pressão à barra e as liberações de alimento.

Procedimentos

O procedimento foi composto por cinco fases experimentais. Os valores de DRL utilizados neste experimento foram DRL 5 s, 10 s e 21 s. Ao longo de todas as fases, os sujeitos L1 e L3 foram colocados na caixa padrão, e os sujeitos L2 e L4, na caixa de atividades. A coleta de dados ocorreu seis vezes por semana, sendo os dias das sessões dos sujeitos L1 e L2 intercalados com os dias das sessões de L3 e L4.

Antes de serem submetidos ao esquema de DRL, todos os sujeitos passaram pelas fases de nível operante (cinco sessões), modelagem e reforçamento contínuo (continuous reinforcement – CRF: duas sessões com 100 pelotas de alimento liberadas). Na sequência, cada um dos sujeitos, colocados em suas respectivas caixas, foram expostos ao esquema de DRL 5 s, durante o qual cada resposta de pressão à barra foi reforçada quando emitida após a passagem de cinco segundos a partir da última resposta emitida. O critério de encerramento de cada sessão foi de 7.200 segundos. Encerrou–se a fase experimental quando foram atingidos três critérios: 1. exposição ao valor do esquema por, no mínimo, dez sessões consecutivas; 2. taxa de respostas das cinco últimas sessões até 10% maior ou menor que a média das taxas dessas mesmas cinco sessões, sem tendência a aumento ou diminuição constante; 3. número de respostas reforçadas das cinco últimas sessões até 10% maior ou menor que a média das mesmas cinco sessões, sem tendência de aumento ou diminuição. Na fase de DRL 10 s, as mesmas condições experimentais e os mesmos critérios de encerramento das sessões e da fase foram mantidos para cada sujeito, e as respostas de pressão à barra foram reforçadas apenas se emitidas após a passagem de dez segundos, contados a partir da última resposta emitida. Por último, os sujeitos foram submetidos à fase de DRL 21 s, durante a qual as respostas de pressão à barra, submetidas ao esquema de DRL 21 s, foram reforçadas quando emitidas após 21 segundos da emissão da última resposta. Mantiveram–se as mesmas condições para os quatro sujeitos, e utilizaram –se os mesmos critérios de encerramento das sessões e das fases 3 e 4.

Resultados

Este artigo descreve uma parcela dos resultados obtidos em uma pesquisa conduzida durante o mestrado da primeira autora que foi orientado pelo segundo (Aureliano, 2008). Os objetivos e resultados da pesquisa abrangeram, inclusive, a análise das atividades realizadas pelos sujeitos, como a sequência de tais atividades, tempo de duração e consumo. Sabemos que esses aspectos podem dialogar com outras linhas de pesquisa, como desempenhos concorrentes, economia comportamental aberta/fechada, ambiente enriquecido e comportamento adjuntivo. No entanto, optamos por deixar essas análises para outras oportunidades, pois o objetivo do presente artigo é apenas discutir os efeitos da exposição a tais atividades sobre um responder operante, neste caso, a resposta de pressão à barra em esquema de DRL.

Análise do desempenho dos sujeitos na caixa padrão e na caixa de atividades

O Gráfico 1 apresenta a taxa média de respostas de pressão à barra por minuto dos sujeitos L1 e L3, ambos submetidos à caixa operante padrão, e de L2 e L4, colocados na caixa de atividades, ao longo das sessões, desde CRF até o último valor do esquema de DRL (21 s).

Durante as sessões de CRF, as taxas de respostas por minuto do sujeito L2 foram semelhantes às dos sujeitos submetidos à caixa padrão: 10 e 11 respostas por minuto, respectivamente. No entanto, L4 apresentou taxas de respostas inferiores àquelas obtidas pelos demais sujeitos (4 e 8 respostas por minuto). Isso ocorreu devido à saída do sujeito do compartimento da barra (C2) para os demais compartimentos, principalmente para a roda de atividades (C5) e o compartimento da água (C3).

A partir da exposição ao esquema de DRL 5 s, as taxas de respostas dos sujeitos submetidos à caixa de atividades diminuíram logo na primeira sessão (5,35 e 4,35 respostas por minuto do L2 e L4, respectivamente). Em seguida, houve um aumento nessas taxas, que se mantiveram no mesmo patamar até o critério de estabilidade ter sido atingido, em 11 sessões para o sujeito L2 e em 14 para o L4. As taxas obtidas pelos sujeitos na caixa padrão foram mais baixas do que as taxas de respostas obtidas pelos sujeitos expostos à caixa de atividades. Na última sessão em DRL 5 s, as taxas obtidas foram: 4,15 e 4,75 dos sujeitos L1 e L3, e 6,10 e 5 respostas por minuto dos sujeitos L2 e L4.

Quando o valor do esquema foi aumentado para DRL 10 s, diferentemente do que ocorreu com os sujeitos L1 e L3, as taxas de respostas por minuto dos sujeitos L2 e L4, nas primeiras sessões, praticamente não sofreram alterações, permanecendo com os mesmos valores obtidos anteriormente. Observa–se também que as taxas de respostas nesse valor do esquema foram menores do que as obtidas sob DRL 5 s (4,5 e 4,29 respostas por minuto para L2 e L4, respectivamente) e também menores do que as taxas atingidas pelos sujeitos L1 e L3, na caixa padrão.

A transição para o esquema DRL 21 s resultou na diminuição da taxa de respostas em comparação com as obtidas nas fases anteriores. As taxas de respostas dos sujeitos L1 e L3 (caixa padrão) com L2 e L4 (caixa de atividades), nessa fase de DRL 21 s, foram semelhantes, principalmente quando são analisadas as últimas sessões de cada sujeito. Outro resultado que vale destacar foi o número de sessões necessárias para que o critério de estabilidade fosse atingido. Isso pode demonstrar uma maior facilidade na adaptação a esse valor do esquema em ambiente aberto, ao contrário do que ocorreu com os sujeitos da caixa padrão, que foram submetidos a um maior número de sessões para atingir o critério de estabilidade estabelecido pelo estudo.

No Gráfico 2, é possível identificar que as taxas de reforços obtidas pelos sujeitos L2 e L4, durante o DRL 5 s, foram semelhantes àquelas obtidas pelos sujeitos submetidos à caixa padrão, sem tendência a aumento ou diminuição ao longo de todas as sessões.

Quando se comparam as taxas de reforços entre os quatro sujeitos, nota–se que os sujeitos submetidos à caixa de atividades obtiveram menos reforços alimentares ao longo de todas as sessões do que os sujeitos colocados na caixa padrão (3,47 e 3,80 reforços por minuto na última sessão em DRL 10 s para os sujeitos L1 e L3, e 2,73 e 2,98 reforços obtidos por minuto pelos sujeitos L2 e L4).

Com a introdução do valor do esquema DRL 21 s, observa–se que a taxa de reforços alimentares por minuto diminuiu ainda mais para os quatro sujeitos (0,6 e 0,7 reforços por minuto para o sujeito L2 e L4, e 0,2 e 0,3 para L1 e L3, respectivamente). Ao longo da exposição dos sujeitos L2 e L4 ao esquema, a taxa de reforço aumentou e permaneceu praticamente constante até o final da fase (1,54 e 1,43 reforços obtidos por minuto, respectivamente, na última sessão). Já os sujeitos da caixa padrão obtiveram taxas de reforços mais elevadas (1,75 e 1,63 reforços por minuto para L1 e L3, respectivamente), valores mais próximos da taxa de reforço por minuto possível de ser atingida no esquema DRL 21 s, que é 2,86. No entanto, essas taxas foram alcançadas após maior número de sessões às quais os sujeitos da caixa de atividade foram expostos para atingir o critério de estabilidade do desempenho.

Análise da efetividade do desempenho dos sujeitos em função do tempo de exposição às atividades sem reforço programado

Utilizou–se como medida da efetividade do desempenho dos sujeitos em função do tempo da sessão experimental a porcentagem de respostas reforçadas. O tempo de cada sessão (120 minutos) foi dividido em seis blocos representando 17 minutos de sessão cada um e um último bloco representando os 18 minutos finais. Esse critério de divisão da sessão foi determinado pelo tipo de registro gerado pelo programa de computador utilizado nessa coleta. Os resultados a seguir se referem às fases de DRL 10 s e 21 s para os quatro sujeitos, e as sessões foram escolhidas por exemplificarem o desempenho em cada etapa da fase experimental (inicial, durante a adaptação do desempenho ao esquema e no período de estabilidade).

A partir do Gráfico 3, identifica–se que L2 e L4 tiveram desempenhos semelhantes ao longo da primeira sessão (variando entre 20% e 41% de respostas reforçadas). Na última sessão, L4 atingiu maiores percentuais de respostas reforçadas do que L2. Já os sujeitos da caixa padrão (L1 e L3) iniciaram a fase com menor percentual de respostas reforçadas do que os sujeitos da caixa de atividades. Todavia, L3 teve 67% das respostas de pressão à barra reforçadas logo no período final da primeira sessão, o maior percentual atingido pelos quatro sujeitos nesse início de fase experimental. Ainda comparando os desempenhos dos quatro sujeitos, agora na última sessão dessa fase, é possível perceber que foram muito semelhantes, o que indica que talvez o acesso a outras atividades sem reforço programado dos sujeitos L2 e L4 não garantiu maior efetividade no responder.

Já na última fase do experimento (Gráfico 4), quando o valor do DRL foi aumentado para 21 segundos, o que se percebe é que os dois sujeitos expostos à caixa de atividades novamente tiveram desempenhos semelhantes entre si, mas, comparando–os com o início da fase anterior, houve diminuição na porcentagem de respostas reforçadas. Ambos os sujeitos melhoraram seus desempenhos ao longo da primeira sessão, no entanto L4 atingiu 64% de respostas reforçadas no final dessa sessão, enquanto L2 alcançou apenas 28%. Quanto às demais sessões, os dois sujeitos tiveram desempenhos parecidos.

Já os sujeitos L1 e L3 ficaram abaixo de 10% das respostas reforçadas ao longo da primeira sessão, desempenho pior do que o dos sujeitos L2 e L4. O sujeito L3 não chegou a atingir 60% de efetividade no responder durante a última sessão em DRL 21 s, enquanto L1 ficou acima dos 70% de respostas reforçadas desde o segundo bloco da última sessão, mantendo–se com os maiores percentuais dentre os quatro sujeitos ao longo dessa sessão.

Com base nessa análise de efetividade do desempenho dos sujeitos em função do tempo de exposição às atividades sem reforço programado, é possível dizer que, quando o valor do esquema DRL foi menor, os sujeitos da caixa padrão apresentaram melhor desempenho do que os expostos à caixa de atividades, apesar de essa melhora ser bastante sutil, portanto, não conclusiva. Os resultados dos quatro sujeitos na fase de DRL 10 s também sugerem que não houve diferenças importantes entre os desempenhos. Já na fase de DRL 21 s, sendo esse um valor de esquema com maior exigência do que os anteriores, os sujeitos da caixa de atividades tiveram maior efetividade no desempenho durante a primeira sessão dessa fase do que os sujeitos da caixa padrão. No entanto, não é possível afirmar que essa melhor efetividade se manteve ao longo da fase, principalmente após a comparação com o desempenho de L1.

Discussão

O objetivo deste trabalho foi investigar os possíveis efeitos da possibilidade de acesso e o tempo de exposição dos sujeitos às atividades para as quais não havia reforçadores programados sobre a efetividade do desempenho sob o esquema de reforçamento DRL. Em relação à efetividade do desempenho em função da possibilidade de acesso a outras atividades, os resultados indicaram que, nos menores valores do esquema de DRL (5 s e 10 s), os sujeitos que não tiveram a possibilidade de engajamento em outras atividades disponíveis apresentaram um melhor desempenho do que aqueles que tiveram tal disponibilidade. Já em DRL 21 s, foram identificadas as maiores diferenças entre os sujeitos colocados nas duas caixas: apesar de apresentarem semelhanças entre as taxas médias de respostas por minuto no final da fase, foram necessárias mais sessões para que o critério de estabilidade fosse atingido para os sujeitos da caixa padrão do que para os outros dois sujeitos. Em relação à taxa média de reforços obtidos, os sujeitos L1 e L3 (caixa padrão) atingiram maiores taxas do que os demais sujeitos, apesar de os sujeitos L2 e L4 terem atingido maiores taxas de reforços com um menor número de sessões do que os sujeitos L1 e L3.

Comparando esses resultados com os descritos em outros estudos, é possível identificar algumas semelhanças. Sales (2006) apontou diferenças de desempenho entre os sujeitos submetidos a ambiente padrão e aqueles submetidos a ambientes de atividades a partir do valor de DRL 9 s. O presente estudo também identificou que as maiores diferenças foram obtidas a partir do valor de DRL 10 s. No entanto, este estudo mostrou que, logo a partir da fase de DRL 10 s, as taxas de reforços obtidos foram maiores para os sujeitos da caixa padrão, na fase de DRL 21 s, do que para os sujeitos que tinham acesso a outras atividades disponíveis. Assim, a partir desses resultados e comparando –os também com os resultados obtidos por McGown et al. (1977), não é possível concluir que o acesso a atividades para as quais não há reforçadores programados exerça uma função essencial para a efetividade do desempenho submetido ao esquema de DRL.

Já McIntire et al. (1983) concluíram que as diferenças entre as taxas de respostas, que foram maiores para os sujeitos em condição fechada, ocorreram em função da disponibilidade de outras atividades. Apesar disso, seus resultados indicam que o tempo de exposição dos sujeitos à contingência programada talvez tenha sido a variável responsável pela semelhança observada (no caso desse estudo, a exposição dos sujeitos a mais de 40 sessões, com duração entre 55 e 65 minutos cada), alcançando taxas semelhantes às apresentadas pelos sujeitos em condição aberta. Assim, a mesma explicação poderia ser utilizada para os resultados obtidos neste estudo, visto que as taxas de respostas obtidas pelos sujeitos nas caixas padrão e de atividades foram semelhantes, e que as sessões, embora tenham sido realizadas em menor quantidade (praticamente metade em número daquelas feitas por McIntire et al. (1983)), tiveram quase o dobro da duração das sessões daquele estudo, podendo ser caracterizado, portanto, como um treino extensivo, já que o tempo de exposição aos esquemas foi parecido.

Ainda sobre a análise dos efeitos do tempo da exposição à contingência em cada sessão sobre a efetividade da resposta de pressão à barra, os resultados indicaram que as porcentagens de respostas reforçadas aumentaram em função do tempo da sessão para os quatro sujeitos. Para os sujeitos na caixa padrão, os percentuais alcançados no início das primeiras sessões em cada fase foram mais baixos do que os atingidos pelos sujeitos em ambiente aberto. Conforme o treino, porém, os percentuais atingidos foram muito semelhantes, apesar de os sujeitos L2 e L4 apresentarem percentuais um pouco mais elevados. Tais resultados se assemelham aos encontrados por Laties et al. (1965) e Laties et al. (1969), que identificaram que as maiores porcentagens de respostas reforçadas, submetidas ao esquema DRL 22 s e 18 s, respectivamente, foram atingidas pelos sujeitos que se engajaram em outras atividades, como morder a cauda e roer o chão da caixa experimental. No entanto, neste estudo, foi possível identificar que os sujeitos na caixa padrão atingiram percentuais semelhantes aos sujeitos submetidos à caixa de atividades apenas após treino mais extensivo do que estes.

Referências

Os resultados deste estudo apontam para a questão de que o acesso a outras atividades não necessariamente garante uma maior efetividade de desempenho. Estudos posteriores, porém, poderiam utilizar outros critérios de estabilidade para as mudanças de fases, como taxa de reforços possíveis de ser obtidos na situação experimental, tempo entre reforços e porcentagem de respostas reforçadas, a fim de comparar os resultados obtidos e checar se as mesmas conclusões poderiam ser feitas a partir de diferentes critérios. Além disso, novos estudos poderiam manipular outras variáveis que não foram o foco deste trabalho, como a manipulação dos possíveis reforçadores envolvidos nas demais atividades disponíveis na caixa de atividades, como a água e o correr na roda de atividades, e manipular diferentes valores de DRL com intervalos ainda menores dos que os utilizados aqui.

Em termos práticos, talvez seja possível afirmar que ter atividades específicas nas quais se engajar pode facilitar a espera para a emissão de respostas reforçadas, mas, mesmo quando não há tais atividades, o longo tempo de exposição a determinada contingência faz com que o desempenho se adapte e também seja efetivo.

Referências

Aureliano, L. F. G. (2008). Os efeitos do tempo de exposição do sujeito às atividades sem reforço programa sobre a efetividade do desempenho em esquema temporal de reforçamento. Dissertação de mestrado, [ Links ] Pontifícia Universidade Católica de São Paulo, São Paulo, SP, Brasil.

Catania, A. C. C. (1999). Aprendizagem: comportamento, linguagem e cognição (4a ed.). (D. G. Souza, Trad.). Porto Alegre: Artmed. (Obra original publicada em 1998). [ Links ]

Derenne, A., & Baron, A. (2002). Preratio pausing: effects of an alternative reinforce on fixed– and variable–ratio responding. Journal of Experimental Analysis of Behavior, 77, 273–282.

Escobar, R., & Bruner, C. A. (2007). Response induction during the acquisition and maintenance of lever pressing with delayed reinforcement. Journal of Experimental Analysis of Behavior, 88, 29–49.

Killeen, P. R., & Fetterman, J. G. (1988). A behavioral theory of timing. Psychological Review, 95, 274–285.

Kramer, T. J., & Rilling, M. (1970). Differential reinforcement of low rates: a selective critique. Psychological Bulletin, 74, 225–254.

Laties, V. G., Weiss, B., Clark, R. L., & Reynolds, M. D. (1965). Overt "mediating" behavior during temporally spaced responding. Journal of Experimental Analysis of Behavior, 8, 107–116.

Laties, V. G., Weiss, B., & Weiss, A. B. (1969). Further observations on overt "mediating" behavior and the discrimination of time. Journal of Experimental Analysis of Behavior, 12, 43–57.

Lejeune, H., Richelle, M., & Wearden, J. H. (2006). About Skinner and time: behavior–analytic contributions to research on animal timing. Journal of Experimental Analysis of Behavior, 85, 125–142.

Machado, A. (1997). Learning the temporal dynamics of behavior. Psychological Review, 104, 241–265.

McGown, W. P., Spencer, W. B., & Neetz, R. (1977). An investigation of collateral wood–chewing as a time–mediational device. Psychological Reports, 41, 1063–1069.

McIntire, K., Lundervold, D., Calmes, H., Jones, C., & Allard, S. (1983). Temporal control in a complex environment: an analysis of schedule–related behavior. Journal of Experimental Analysis of Behavior, 39, 465–478.

Sales, T. M. (2006). Um estudo sobre as atividades nas quais os sujeitos se engajam durante o intervalo entre respostas que produzem reforço. Dissertação de mestrado, Pontifícia Universidade Católica de São Paulo, São Paulo, SP, Brasil. [ Links ]

Staddon, J. E. R., & Simmelhag, V. L. (1971). The "superstition" experiment: a reexamination of its implications for the principles of adaptive behavior. Psychological Review, 78, 3–43.

Zeiler, M. D. (1984). The sleeping giant: reinforcement schedules. Journal of Experimental Analysis of Behavior, 42, 485 –493.

Endereço para correspondência:
Lívia Ferreira Godinho Aureliano
Rua Cuiabá, 353, ap. 112, Mooca
São Paulo – SP – Brasil. CEP: 03183–001
E–mail: liviaaureliano@gmail.com

Submissão: 9.5.2013
Aceitação: 12.5.2014