Aquisição de respostas de diferentes custos após exposição a estímulos não contingentes

Silva, Carlos Henrique S. da; Micheletto, Nilza

doi:10.5935/1980-6906/psicologia.v22n3p161-184

Services on Demand

article

Automatic translation

Indicators

Access statistics

Permalink

Psicologia: teoria e prática

Print version ISSN 1516-3687

Psicol. teor. prat. vol.22 no.3 São Paulo Sep./Dec. 2020

http://dx.doi.org/10.5935/1980-6906/psicologia.v22n3p161-184

ARTIGOS
DESENVOLVIMENTO HUMANO

Aquisição de respostas de diferentes custos após exposição a estímulos não contingentes

Carlos Henrique S. da Silva; Nilza Micheletto

Pontifícia Universidade Católica de São Paulo (PUC-SP), São Paulo, SP, Brasil

Correspondência

RESUMO

Este experimento investigou se a exposição a estímulos apetitivos não contingentes tem efeitos sobre a aquisição de respostas de diferentes custos. Na fase 1, ratos foram expostos a eventos contingentes às respostas de focinhar, eventos não contingentes ou não foram expostos. Na fase 2, a resposta de pressão à barra dos animais foi reforçada continuamente ou em esquema FR 3. O tempo e o número de reforçadores para aquisição de respostas variaram entre os sujeitos, não sendo identificada relação entre a exposição na fase 1 e o custo da resposta a ser adquirida na fase 2. O maior tempo para aquisição da resposta ocorreu possivelmente por causa de respostas competitivas acidentalmente seguidas por estímulos apetitivos na fase 1. Discutem-se possibilidades para estudos futuros e possíveis implicações para o contexto aplicado.

Palavras-chave: desamparo aprendido; estímulos apetitivos não contingentes; eventos independentes da resposta; contiguidade; competição de respostas.

1. Introdução

Uma característica da contingência de três termos é a relação de dependência entre respostas e eventos do ambiente. Além disso, a noção de contingência implica a probabilidade de um evento ocorrer dada a presença da resposta. Na contingência, o evento ocorre após a resposta, podendo ou não haver contiguidade (justaposição dos eventos no tempo). Quando o evento ocorre independentemente da emissão da resposta, dizemos que as relações entre eventos são apenas contíguas (Baum, 2017).

Efeitos de relações de independência entre a resposta e os eventos que lhe são contíguos são apontados por Skinner (1948) em um experimento no qual o pombo recebia alimento a cada 15 segundos independentemente de qualquer resposta. Com isso, estabeleceram-se respostas que se mantiveram, tais como girar rapidamente para um lado ou ao redor de si. Essas respostas selecionadas foram chamadas por Skinner (1948) de comportamento "supersticioso". Posteriormente à identificação do comportamento supersticioso, autores realizaram estudos envolvendo o fenômeno ou esquemas não contingentes e salientaram que a contiguidade entre eventos pode ser suficiente para a instalação de respostas que são seguidas por estímulos não contingentes (por exemplo, Cardoso, Britto, & Simonassi, 2016).

Resultados diferentes são explicitados por Maier e Seligman (2016), que trazem informações relevantes a respeito de contribuições em um conjunto de pesquisas que avaliaram os efeitos da exposição a eventos não contingentes sobre a aquisição de comportamento em situações futuras. O delineamento triádico é apresentado como o modelo experimental para o estudo desses efeitos. Nesse modelo, em geral, o experimento é dividido em duas fases envolvendo três grupos de sujeitos. Tradicionalmente, na fase 1, os sujeitos do grupo fuga (contingente) recebem, no piso da caixa, choques elétricos que podem ser desligados ao emitirem alguma resposta (por exemplo: pressão ao painel em cães, pressão à barra em ratos). O grupo não fuga (não contingente) é acoplado aos sujeitos do grupo fuga, ou seja, recebe os choques nos mesmos momentos, intensidades e durações, com a diferença de que nenhuma resposta pode desligar o choque. O grupo controle não é exposto a essa fase. Na fase 2, os sujeitos de todos os grupos são colocados individualmente em uma caixa experimental em que são liberados choques, e, ao pularem de um compartimento para o outro, o choque é desligado.

Os resultados da fase 1 do grupo contingente nesses delineamentos mostram que a latência entre o início do choque e a resposta analisada diminui ao longo da fase. Para os sujeitos que não podem desligar os choques, as latências são altas durante toda a fase, e os sujeitos param de responder. Na fase 2, o grupo contingente e o controle aprendem a resposta de fuga dos choques. Entretanto, o grupo exposto aos estímulos aversivos não contingentes não aprende. A dificuldade de aprendizagem de uma resposta, após a exposição a estímulos aversivos não contingentes, é chamada de "desamparo aprendido" (Maier & Seligman, 2016).

Diferentes hipóteses para o fenômeno têm sido discutidas na literatura. A do desamparo aprendido (Maier & Seligman, 2016) estabelece que o sujeito aprende, durante a exposição à incontrolabilidade, a relação de independência entre suas respostas e os eventos ambientais, e essa aprendizagem interfere na aquisição de uma resposta operante. Glazer e Weiss (1976) falam da inatividade aprendida: um padrão de baixa atividade é selecionado por contingências acidentais na fase 1, e tal padrão é incompatível com o padrão de respostas a serem aprendidas na fase 2. Já Hunziker e Gehm (2010) tentam explicar os efeitos sugerindo que a exposição prévia a estímulos não contingentes na fase 1 pode interferir no desempenho posterior a depender do tempo entre resposta e consequência na fase 2. Especificando: o desamparo será mais provável quanto maior for o tempo entre a emissão da resposta operante e a consequência e menos provável com um tempo menor (Hunziker & Gehm, 2010).

Após as investigações com estímulos aversivos, Engberg, Hansen, Welker e Thomas (1972) investigaram a possibilidade de produção dos mesmos efeitos ao exporem pombos, distribuídos em grupos em delineamento de tríade, a estímulos não aversivos não contingentes (apetitivos) e avaliarem os efeitos na aquisição de uma resposta operante. Identificaram que sujeitos expostos a estímulos não contingentes precisaram de mais tentativas para adquirir a resposta, mostrando a possível generalidade do desamparo aprendido.

Estudos realizados posteriormente tentaram produzir efeitos similares ao desamparo aprendido ao utilizarem estímulos apetitivos, alguns reportando atraso na aquisição da resposta operante após exposição a estímulos apetitivos não contingentes (por exemplo, Job, 1988; Oakes, Rosenblum, & Fox, 1982; Welker, 1976) e outros não (por exemplo, Beatty & Maki, 1979; Schwartz, Reisberg, & Vollmecke, 1974). Apesar da relevância da compreensão de possíveis efeitos da exposição a estímulos apetitivos não contingentes sobre a aquisição de novas respostas, não foram encontrados estudos após a década de 1990 para confirmar a generalidade dos efeitos obtidos com estímulos aversivos.

Entre os estudos que não reportaram consistências, Schwartz et al. (1974) investigaram a presença ou ausência do manipulando da fase 1 na fase 2 e identificaram que é mais provável haver o efeito de atraso quando o manipulando está ausente na fase 2; e Beatty e Maki (1979) manipularam diferentes quantidades de estímulos apetitivos não contingentes na fase 1, mas os dados não mostraram diferenças na posterior aquisição do responder.

Já entre os estudos que reportaram consistências está o de Oakes et al. (1982), no qual controlaram a quantidade de alimento recebida pelos grupos contingente, não contingente e controle na fase 1, e, na fase 2, todos foram expostos à aquisição da resposta de pressão a uma barra retrátil, pontuando maior tempo na aquisição do responder no grupo que recebia estímulos não contingentes. E Job (1988) manipulou a presença ou ausência do manipulando entre as fases, bem como reforçamento contínuo ou intermitente na fase 1 para o grupo contingente. Maior tempo na aquisição do responder operante ocorreu independentemente de ter sido usado o reforçamento contínuo ou intermitente na fase 1, quando 1. o manipulando da fase 2 estava presente na fase 1 e 2. o manipulando da fase 1 estava ausente na fase 2.

Na análise dos estudos, foi possível notar que a ênfase das manipulações tem sido mais na fase 1, e, na Fase 2, geralmente é usado o reforçamento contínuo (continuous reinforcement - CRF). Diferentemente, o estudo de Welker (1976) manipulou, na fase 2, diferentes custos da resposta a ser adquirida, sugerindo ser o custo da resposta uma variável relevante que interfere nessa aquisição. Welker (1976) distribuiu pombos em três grupos: contingente, não contingente e controle. Na fase 1, o grupo contingente emitia a resposta de pressão ao pedal que era reforçada em um esquema de reforçamento de intervalo variável (variable interval - VI 15s, 30s, 45s), enquanto, para o grupo não contingente (não acoplado), o alimento era liberado em esquema de tempo variável (VT 15s, 30s e 45s). O grupo controle recebeu apenas treino ao alimentador. Na fase 2, os três grupos bicavam uma chave produzindo alimento em CRF. O tempo para a aquisição dos 50 primeiros reforçadores foi maior para o grupo não contingente. No segundo experimento, o autor avaliou diferentes custos utilizando o esquema de razão fixa (fixed ratio - FR 3) na fase 2. Maior tempo foi gasto nos primeiros 50 reforços empregando FR quando comparado ao uso do CRF. Não houve diferenças no tempo gasto para aquisição dos 50 últimos reforçadores, nos dois experimentos, indicando a transitoriedade do efeito.

Outro estudo que utilizou FR 3 na fase 2 foi o de Beatty e Maki (1979). Embora os autores não tenham investigado diretamente o custo da resposta, utilizaram na fase 2 um esquema que foi analisado por Welker (1976) como mais custoso. Como resultado, não houve diferenças significativas entre os grupos no tempo para a aquisição de reforçadores.

Ante as divergências de resultados em relação aos efeitos do custo da resposta na fase 2 e o fato de que apenas Welker (1976) comparou diferentes custos, a presente pesquisa teve o objetivo de verificar o efeito da exposição a estímulos apetitivos não contingentes sobre a posterior aquisição de respostas de diferentes custos. Diferentemente de Welker (1976), o presente estudo utilizou ratos como sujeitos experimentais e o delineamento de tríades, acoplando os sujeitos do grupo não contingente ao grupo contingente.

Além de poder colaborar para a identificação variáveis que podem estar relacionadas aos diferentes resultados produzidos, um estudo para avaliar os efeitos da exposição a estímulos apetitivos não contingentes sobre a aquisição posterior de respostas de diferentes custos pode ter implicações práticas. Estudos aplicados que trabalham com comportamentos socialmente relevantes em geral apontam a efetividade da exposição a eventos não contingentes para a diminuição de comportamentos-problema (Moore, Robinson, Coleman, Cihak, & Park, 2016; Phillips, Iannaccone, Rooker, & Hagopian, 2017; Rooker, Bonner, Dillon, & Zarcone, 2018). Os efeitos desse procedimento em uma tarefa subsequente, entretanto, ainda não estão claros, pois os estudos experimentais básicos que utilizam estímulos apetitivos apresentam resultados inconsistentes (por exemplo, Beatty & Maki, 1979; Job, 1988; Oakes et al., 1982; Schwartz et al., 1974; Welker, 1976). A pesquisa básica sobre isso poderá ser o fundamento para pesquisas translacionais futuras.

2. Método

2.1 Sujeitos

Foram utilizados 18 ratos machos Wistar, com idades entre 90 e 120 dias no início do experimento, mantidos em gaiolas individuais sob regime de restrição hídrica, de modo a pesarem, durante o experimento, de 80% a 85% do valor ad libtum. O Projeto n. 0012-15 foi aprovado pelo Comitê de Ética da Faculdade de Ciências Humanas e da Saúde da Pontifícia Universidade Católica de São Paulo (PUC-SP).

2.2 Equipamentos

Três caixas de condicionamento operante medindo 25,5 x 32 x 26 cm (altura, largura e profundidade, respectivamente) dentro de caixas de madeira que permitem isolamento acústico (47 x 67 x 47,5 cm, respectivamente) foram usadas nas duas fases. As caixas foram equipadas com um bebedouro, posicionado no centro da parede direita da câmara.

Na fase 1, um focinhador estava localizado a 6 cm do piso e ao lado esquerdo do bebedouro e continha uma abertura circular de 2,5 cm de diâmetro, na qual o sujeito precisava inserir o focinho a uma profundidade de pelo menos 1,5 cm para interromper o raio infravermelho e para que a resposta de focinhar fosse registrada. Na fase 2, uma barra de 4,5 cm de comprimento e 2,5 cm de profundidade foi instalada a 7 cm do piso e do lado direito do bebedouro. Uma câmera da marca CE AE25 acoplada a um aparelho Digital Video Recorder (DVR), modelo VD 4S 120 ST, permitiu a filmagem das sessões.

2.3 Procedimento

Os sujeitos foram alocados em uma das seis condições, com três sujeitos em cada, denominadas: reforçamento contínuo contingente (CRF-C), reforçamento de razão fixa contingente (FR-C), reforçamento contínuo não contingente (CRF-NC), reforçamento de razão fixa não contingente (FR-NC), reforçamento contínuo controle (CRF-CT) e reforçamento de razão fixa controle (FR-CT).

2.4 Fase 1: exposição a estímulos apetitivos contingentes/não contingentes

As diferenças de procedimentos nessa fase ocorreram apenas entre as condições contingentes, não contingentes e controles. Nas condições contingentes (CRF-C e FR-C), não houve modelagem, e, após treino ao bebedouro, as respostas de focinhar foram seguidas por apresentação de água até que 100 respostas fossem emitidas. Nas sessões seguintes, utilizou-se o esquema de reforçamento de intervalo variável (VI 15s, VI 30s e VI 45s, nessa ordem) programado com dez valores em cada VI. O critério para encerramento das sessões em que vigorou VI 15s foi a apresentação de 100 reforçadores ou a passagem de 50 minutos. Nas sessões em que vigoraram VI 30s e VI 45s, o critério para encerramento foi a passagem de 50 minutos. Para a mudança de um valor de VI para outro e para o encerramento da fase 1, utilizaram-se os seguintes critérios: 1. o número total de respostas de cada sujeito contingente nas três últimas sessões em que vigorou o mesmo valor de VI não podia variar mais que 10%; 2. todos os seis sujeitos das condições contingentes deveriam atingir o primeiro critério na mesma sessão para igualar a exposição ao número de sessões.

Cada sujeito das condições não contingentes (CRF-NC e FR-NC), após treino ao bebedouro, foi acoplado a um da condição contingente. Dessa forma, toda vez que a resposta do sujeito contingente foi reforçada, liberou-se a água também para o seu par não contingente, independentemente de qualquer resposta. Respostas de focinhar não tiveram consequências programadas. O encerramento das sessões e da fase era determinado por seu par contingente. Os sujeitos controle (CRF-CT e FR-CT) fizeram só treino ao bebedouro.

2.5 Fase 2: aquisição de resposta operante

O focinhador foi removido do lado esquerdo do bebedouro e a barra inserida ao lado direito. Não houve modelagem. As diferenças de procedimentos ocorreram no esquema de reforçamento da resposta de pressão à barra, entre as condições

CRF e FR. A primeira sessão foi realizada 24 horas após o fim da primeira fase, e a segunda sessão, 48 horas depois. As sessões foram encerradas após a aquisição de 100 reforçadores ou a passagem de 50 minutos. O experimento foi encerrado após duas sessões. As respostas dos sujeitos das condições CRF (CRF-C, CRF-NC e CRF-CT) foram reforçadas continuamente (CRF). A primeira resposta dos sujeitos das condições FR (FR-C, FR-NC e FR-CT) foi reforçada e as demais em razão fixa (FR 3).

2.6 Análise de vídeos e concordância entre observadores

Para verificar a possibilidade de a apresentação de estímulos não contingentes poder ter fortalecido respostas que os antecederam, analisaram-se os vídeos da última sessão da fase 1 e da primeira sessão da fase 2 dos sujeitos acoplados. Essas sessões foram divididas em blocos de dez segundos e registradas: 1. a ocorrência de respostas dentro de cada bloco de dez segundos; 2. a resposta que antecedeu a entrega do estímulo apetitivo não contingente em um segundo. Analisou-se também a primeira sessão da fase 2 dos sujeitos contingentes para verificar 3. a possibilidade de as respostas fortalecidas na fase 1 terem sido emitidas na fase 2. Um observador independente fez os mesmos registros para ambas as sessões, o que permitiu o cálculo do índice de concordância, utilizando a fórmula: [Concordância/ (Discordância + Concordância)] x 100 (Saini, Fisher, & Pisman, 2017). Os índices variaram em 1. de 86% a 97%; em 2. de 93% a 100%; e em 3. de 91% a 98%.

3. Resultados

O custo da resposta, diferenciado por meio dos esquemas CRF ou FR 3, foi analisado como possível variável que interfere na aquisição do responder após a exposição a estímulos apetitivos não contingentes. A Figura 3.1 apresenta as curvas de frequência acumulada de respostas de pressão à barra dos sujeitos das tríades, emitidas na fase 2 pelos sujeitos das condições contingente (linhas pontilhadas) - CRF-C, não contingente (linhas contínuas) - CRF-NC e controle (linhas com traço e ponto) - CRF-CT reforçadas em CRF na primeira e segunda colunas, e pelos sujeitos das condições de reforçamento em FR 3(contingente - FR-C, não contingente - FR-NC e controle - FR-CT) na terceira e quarta colunas. As colunas um e três referem-se à primeira sessão; e as colunas dois e quatro, à segunda.

Nota-se, já na primeira sessão, que a resposta de pressão à barra foi selecionada para os sujeitos expostos ao CRF (Figura 1, primeira coluna). Os sujeitos 1CRF-NC e 2CRF-NC, que foram expostos na fase 1 a estímulos não contingentes, iniciaram e finalizaram a sessão mais rapidamente e apresentaram curvas mais aceleradas que os outros sujeitos de suas respectivas tríades. Já na terceira tríade, os sujeitos da condição 3CRF-NC levaram mais tempo que os outros de condições CRF para iniciar a tarefa e para a resposta ser selecionada. Após seleção da resposta, a aceleração da curva foi um pouco maior do que a dos outros de sua tríade. Dessa forma, dentre os sujeitos não contingentes CRF, apenas um levou mais tempo que os demais para a aquisição da resposta.

Em relação aos outros sujeitos da condição de CRF-C, é possível notar diferentes desempenhos. Na primeira sessão da fase 2, o sujeito 1CRF-C levou mais tempo para finalizar a sessão, e a curva foi menos acelerada quando comparado ao sujeito 1CRF-NC. Esse dado parece se repetir na primeira metade da segunda sessão. Já a curva do sujeito 2CRF-C é a menos acelerada da tríade nas duas sessões da fase 2. O sujeito 3CRF-C foi o mais rápido da tríade na primeira sessão, teve uma curva mais acelerada que os demais, entretanto, na sessão seguinte, levou mais tempo para finalizar a sessão. Sobre os sujeitos controle CRF, apenas um (1CRF-CT) apresentou menor aceleração e maior tempo para iniciar e finalizar as sessões em comparação com a sua tríade, visto que os demais (2CRF-CT e 3CRF-CT) foram os segundos de suas tríades a finalizar a sessão. Esses dados indicam que, em CRF, não houve consistências no que se refere ao tempo de aquisição da resposta a depender do tipo de exposição na fase 1. Apenas um sujeito exposto na fase 1 a estímulos não contingentes (3CRF-NC) levou mais tempo para a aquisição da resposta de pressão à barra.

Nas condições FR (terceira e quarta colunas), entre os sujeitos expostos a estímulos não contingente na fase 1, apenas o sujeito 1FR-NC levou maior tempo para aquisição do responder. Apresentou muitas pausas, uma curva menos acelerada do que a dos demais e até o final da sessão não obteve todos os reforçadores. O sujeito 2FR-NC iniciou e terminou a tarefa antes dos outros dois sujeitos de sua tríade. O sujeito 3FR-NC concluiu a sessão em um tempo maior que o sujeito exposto à condição contingente (3FR-C). Os sujeitos 1FR-C e 3FR-C, expostos à condição contingente, apresentaram as curvas mais aceleradas de suas tríades. Já a curva de 2FR-C foi menos acelerada apenas que a do acoplado da tríade. Da condição controle, 2FR-CT e 3FR-CT tiveram as curvas menos aceleradas dentro de suas tríades e finalizaram a primeira sessão sem obter 100 reforços. A curva de 1FR-CT foi menos acelerada do que a do contingente e mais acelerada que a do acoplado.

Na segunda sessão (quarta coluna), todas as tríades obtiveram todos os reforços e mantiveram a ordem de término da sessão, e observaram-se uma maior aceleração nas curvas de todos os sujeitos e uma distinção menor entre os sujeitos das tríades e entre tríades. Assim, pode-se dizer que, como nas condições de CRF, os sujeitos expostos na fase 2 a FR 3 também apresentaram desempenhos variados, independentemente da forma de tratamento na fase 1, e apenas um sujeito expos-to a estímulos não contingentes (1FR-NC) apresentou um tempo maior para a aquisição da resposta de pressão à barra.

Outra medida avaliada foi o tempo para a aquisição dos reforçadores (1, 1 a 10, 11 a 50, 51 a 100 e 0 a 100 reforçadores) para os sujeitos das condições CRF (primeira e segunda colunas) e FR (terceira e quarta colunas) nas duas sessões da fase 2 (Figura 3.2). Setas com números na terceira coluna indicam a quantidade de reforçadores adquirida pelos sujeitos 1FR-NC, 2FR-CT e 3FR-CT, que finalizaram a sessão pelo critério de tempo.

A maior diferença entre todos os sujeitos das condições CRF é mostrada na terceira tríade. O sujeito não contingente 3CRF-NC precisou de mais tempo para a aquisição do primeiro reforçador e para terminar a primeira sessão quando comparado aos outros sujeitos não contingentes. Ele foi também um dos que levaram mais tempo para obter dez reforçadores. Nas tríades 1 e 2, 1CRF-NC e 2CRF-NC foram os mais rápidos para a aquisição de todos os reforçadores na primeira sessão. Na condição controle, 1CRF-CT foi o que mais precisou de tempo para obter todos os reforços. Na tríade 2, o sujeito contingente 2CRF-C precisou de mais tempo entre os reforçadores 11 a 50, 51 a 100 e para finalizar a sessão. Os dados da segunda sessão para as tríades 2 e 3 são semelhantes: 2CRF-C e 3CRF-C permaneceram mais tempo na sessão; e 2CRF-NC e 3CRF-NC, um tempo menor. Esses dados sugerem que, em CRF, o tempo gasto para a aquisição de reforçadores na fase 2 não pareceu depender da forma de tratamento na fase 1.

Para os sujeitos que foram expostos ao esquema de reforçamento FR 3 (colunas 3 e 4), na primeira sessão, 1FR-NC levou mais tempo para a aquisição de todos os reforçadores (1 a 10, 11 a 50), comparado aos outros de sua tríade, e adquiriu apenas 91 reforçadores de 100. Ele também precisou de mais tempo que os outros de sua tríade na segunda sessão. Quando se comparam o atraso apresentado pelo sujeito da condição CRF (3CRF-NC) e o da condição FR (1FR-NC), observa-se que 3CRF-NC levou mais tempo apenas na emissão da primeira resposta, na aquisição dos reforçadores 1 a 10 e no tempo total da primeira sessão. Até o fim da segunda sessão, 1FR-NC levou mais tempo do que os outros da tríade e não produziu os 100 reforçadores.

Dados diferentes foram obtidos nas outras tríades, pois os sujeitos da condição controle necessitaram de maior tempo para a aquisição de 100 reforçadores. Na tríade 2, 2FR-CT obteve apenas 73 reforçadores, e 3FR-CT, na tríade 3, obteve 55 durante o tempo da primeira sessão. Na segunda sessão, tanto na condição CRF como na FR, todos adquiriram 100 reforçadores, com diferenças entre os membros das tríades menos acentuadas.

Em suma, a análise do tempo para a aquisição de reforçadores, bem como a análise das curvas da resposta de pressão à barra, mostrou que não houve consistências em relação ao tempo de aquisição da resposta na fase 2, a depender de diferentes exposições na fase 1. A exposição a estímulos contingentes, não contingentes e a não exposição na Fase 1 e a manipulação do custo de respostas na fase 2 não levaram a conclusões consistentes, visto que apenas um sujeito não contingente que foi exposto a CRF (3CRF-NC) e um que foi exposto a FR 3 (1FR-NC) adquiriam a resposta de pressão à barra em tempo maior que os demais das tríades. Não se identificou, portanto, efeito da exposição a estímulos apetitivos não contingentes sobre posterior aquisição de respostas de diferentes custos.

Vídeos da última sessão da fase 1 foram analisados para verificar se respostas podem ter sido instaladas por serem seguidas por eventos não contingentes para alguns sujeitos que levaram um tempo maior para a aquisição de reforçadores e, assim, concorreram com a de pressão à barra, na fase 2. A Tabela 3.1 mostra o número de respostas emitidas pelos sujeitos das condições não contingentes na última sessão da fase 1 e na primeira sessão da fase 2, e o total de contiguidades temporais entre resposta e estímulo apetitivo não contingente na fase 1.

Todos os sujeitos não contingentes emitiram um alto número de respostas na última sessão da fase 1. Apesar de baixa emissão de respostas de focinhar, houve a emissão de outras respostas antes da apresentação do estímulo apetitivo. Algumas foram emitidas em maior número em comparação a outras: respostas de farejar o teto (3FR-NC emitiu 134) e farejar o piso (2CRF-NC, 3CRF-NC, 1FR-NC e 3FR-NC emitiram, 233, 138, 83 e 136, respectivamente).

Quase todas as respostas emitidas na sessão anterior (fase 1) em maior número continuaram a ser emitidas no início da fase 2 para todos os sujeitos não contingentes. Entretanto, na fase 2, os sujeitos que necessitaram de maior tempo (Figura 3.2) para aquisição da resposta de pressão à barra (3CRF-NC e 1FR-NC) emitiram um grande número de outras respostas em comparação com os sujeitos não contingentes que foram os mais rápidos de suas tríades (1CRF-NC, 2CRF-NC e 2FR-NC). Os sujeitos 3CRF-NC e 1FR-NC emitiram na fase 2, respectivamente, 277 e 263 respostas que não a de pressão à barra. Por sua vez, 1CRF-NC, 2CRF-NC e 2FR-NC emitiram, respectivamente, 16, 46 e 27 respostas.

Os dados parecem indicar um padrão de responder que esteve, pelo menos no início da primeira sessão da fase 2, em competição com a resposta de pressão à barra, justificando o maior tempo para a aquisição da resposta apresentado por alguns sujeitos. Talvez seja possível afirmar que, na fase 2, o tempo envolvido na emissão das respostas que foram em algum momento acidentalmente seguidas por estímulos apetitivos não contingentes no final da fase 1 (Tabela 3.1) e algumas topografias de respostas (farejar o teto ou o piso, lamber o bebedouro) impediram inicialmente a emissão da resposta de pressão à barra (Figura 3.1).

Conforme a Tabela 3.1, esses sujeitos emitiram entre 629 (1CRF-NC, 653; 2CRF-NC, 629; 3CRF-NC, 655; 1FR-NC, 669) e 841 (3FR-NC) respostas na última sessão da fase 1. Na fase 2, os sujeitos que mais demoraram para pressionar a barra sistematicamente (3CRF-NC, 1800" e 1FR-NC, 898" aproximadamente) foram aqueles que emitiram um maior número de respostas (277 e 263, respectivamente) que tinham ocorrido na fase anterior com alta contiguidade, quando comparados aos demais. Pode-se supor que o total de respostas que não a de pressão à barra, emitido por ambos os sujeitos, estava em competição com a de pressão à barra. Por conta disso, foi necessário mais tempo para que as respostas pudessem ser selecionadas. Já outros sujeitos, que foram os primeiros a finalizar a sessão dentro de suas tríades, iniciaram e tiveram o responder na barra selecionado em um menor tempo (1CRF-NC, 39"; 2CRF-NC, 81"; 2FR-NC, 116"). O fato de esses sujeitos terem emitido um número menor de outras respostas na fase 2 (16, 46 e 27, respectivamente) pode ter interferido na emissão e seleção da resposta de pressão à barra mais rapidamente. O sujeito 3FR-NC apresentou 217 respostas na fase 2, pouco menos que os não contingentes que levaram mais tempo de suas tríades, e adquiriu a resposta de pressão à barra após o sujeito contingente e antes do controle de sua tríade. Entretanto, diferentemente deles, 3FR-NC foi o que pressionou a barra e produziu reforço pela primeira vez em menor tempo (34") quando comparado com os outros não contingentes (1CRF-NC, 39"; 2CRF-NC, 81"; 3CRF-NC, 1356"; 1FR-NC, 66"; 2FR-NC, 116").

Também para os sujeitos contingentes é possível que respostas da fase 1 tenham atrasado a seleção da resposta na fase 2, visto que alguns sujeitos, na fase 2, não foram os primeiros a finalizar a tarefa (1CRF-C, 2CRF-C e 2FR-C), o que geralmente é esperado em estudos com estímulos aversivos. Na fase 2, identificaram-se respostas topograficamente semelhantes ao focinhar mesmo com o focinhador ausente. Consideraram-se "respostas semelhantes ao focinhar", como to-car com o focinho a parede, no local em que o focinhador estava instalado, pois parece que respostas de focinhar que foram fortalecidas na fase 1 competiram com a resposta de pressão à barra. Os sujeitos contingentes que mais rapidamente terminaram a primeira sessão da fase 2, em relação aos demais que tiveram a resposta de mesmo custo reforçada (1CRF-C, 835"; 1FR-C, 837"; 3CRF-C, 1243"), foram os que emitiram um número menor de respostas "semelhantes ao focinhar" (30, 28 e 17 respectivamente). Comparando-se com aqueles contingentes que levaram mais tempo em relação aos demais que tiveram o mesmo custo de resposta (2FRC, 2957"; 2CRF-C, 2021"), observa-se a emissão de um maior número de respostas "semelhantes ao focinhar" (129 para ambos).

4. Discussão

Neste experimento, não foi identificado um efeito claro da história de exposição a diferentes condições (contingente, não contingente e sem exposição) sobre a aquisição de respostas de diferentes custos, uma vez que a condição não contingente não foi a que sistematicamente exigiu mais tempo para a aquisição da resposta. Observou-se, também, variabilidades intra e entre condições. Os sujeitos que precisaram de mais tempo para a aquisição da resposta dentro de suas tríades das três condições são: não contingente (3CRF-NC, 1FR-NC), contingente (2CRF-C) e controle (1CRF-CT, 2FR-CT e 3FR-CT). De forma semelhante, os sujeitos com os melhores desempenhos dentro de suas tríades são das condições não contingente (1CRF-NC, 2CRF-NC e 2FR-NC) e contingente (3CRF-C, 1FR-NC e 3FR-NC).

O fato de haver sujeitos expostos ao CRF apresentando mais tempo na aquisição do responder após exposição a estímulos não contingentes não é incomum, visto que alguns estudos mostram o mesmo resultado (Engberg et al., 1972; Job, 1988; Oakes et al., 1982; Schwartz et al., 1974; Welker, 1976). Os experimentos de Welker (1976), que também compararam a aquisição de respostas em CRF e FR 3, apesar de concluírem por uma análise estatística que o uso do FR 3 exigiu mais tempo, também identificaram que alguns sujeitos expostos ao CRF também leva-ram mais tempo para aquisição da resposta.

Neste estudo, não se observou uma sistemática diferença entre os sujeitos das condições CRF e FR. Esses dados discrepantes sugerem que outras condições relativas às condições experimentais e à história experimental de cada sujeito precisem ser analisadas para compreender essas diferenças.

Beatty e Maki (1979), que utilizaram na fase 2 a resposta de pressão à barra reforçada em FR 3, em ratos, também não observaram diferenças quando comparados aos sujeitos que não foram expostos. Deve ser destacado que, diferentemente do presente estudo, o manipulando (barra) esteve presente tanto na fase 1 como na 2, na qual foi avaliada a aquisição da resposta de pressão à barra. Apesar de os autores não proverem dados de pressão à barra na fase 1 do estudo, é possível que tenha havido a instalação de algum padrão supersticioso no responder entre os sujeitos não contingentes na fase 1, e isso facilitou a realização da tarefa na fase 2. Essa análise sobre o uso do mesmo manipulando entre as fases facilitando a aquisição da nova resposta é apontada por Schwartz et al. (1974).

Neste estudo, buscou-se identificar, com a análise do desempenho na fase 1, variáveis que podem estar relacionadas às dificuldades na seleção de respostas por sujeitos expostos a diferentes histórias. Segundo Engberg et al. (1972) e Schwartz et al. (1974), respostas competitivas fortalecidas na fase 1 podem dificultar a aquisição da resposta na fase 2.

A análise dos vídeos da última sessão da fase 1 para os sujeitos não contingentes apontou para respostas que parecem ter sido mantidas por estímulos não contingentes. Estudos como o de Cardoso et al. (2016) têm mostrado o papel da contiguidade temporal no fortalecimento de respostas. Ainda, essas respostas fortalecidas por contiguidade no final da fase 1 parecem ter competido (reduzindo o tempo para emissão e/ou concorrendo) com a resposta de pressão à barra na fase 2, visto que foi identificado um alto número dessas respostas na fase 2 principalmente antes da aquisição da nova resposta. Engberg et al. (1972) desconsideraram essa interpretação em seus dados afirmando que a possibilidade de instalação de respostas acidentalmente reforçadas seria baixa porque a apresentação dos estímulos foi em tempo variável e não em tempo fixo. No presente estudo, a mensuração de outras respostas e suas contiguidades com eventos apetitivos mostrou que é possível a instalação dessas respostas quando os estímulos são apresentados em tempo variável.

Neste estudo, não se utilizou o mesmo manipulando nas duas fases, nem o focinhador (manipulando da fase 1) foi utilizado na fase 2. Contudo, registrou-se um número elevado de respostas sem atraso em ambas as fases. Essas respostas frequentes foram emitidas na caixa experimental (por exemplo, teto da caixa, piso). Talvez a utilização, neste estudo, da mesma caixa nas duas fases possa ter oportunizado que as respostas emitidas na fase 1 tenham sido evocadas na fase 2.

Job (1988) faz menção às respostas competitivas em condições contingentes por causa da utilização da mesma caixa experimental nas duas fases. Oakes et al. (1982) utilizaram caixas diferentes entre fases e não relatam respostas competitivas dos sujeitos contingente e não contingente. O uso de uma caixa diferente na fase 2 talvez possa evitar que os sujeitos de condições contingente e não contingente emitam tais respostas, controlando variáveis que podem ter interferido na avaliação dos efeitos das condições contingente e não contingente.

Os estudos que usam estímulos aversivos apontam para diferentes hipóteses explicativas para o efeito produzido pela exposição a estímulos não contingentes. A do desamparo aprendido (Maier & Seligman, 2016) estabelece que os sujeitos expostos a estímulos aversivos incontroláveis podem apresentar dificuldade de aprendizagem de uma resposta operante. Os dados do presente estudo não podem ser interpretados à luz dessa hipótese, pois, apesar do planejamento de uma condição de "incontrolabilidade" no recebimento de água, todos os sujeitos não contingentes emitiram respostas que foram seguidas pelo estímulo apetitivo, o que impediria a aprendizagem da ausência da relação R-S.

Outra hipótese proposta em estudos com estímulos aversivos é a da inatividade aprendida (Glazer & Weiss, 1976), que estabelece que a baixa atividade dos sujeitos expostos a choques incontroláveis deve-se às contingências acidentais: o término do choque coincide com o momento no qual o sujeito está parado, e esse padrão selecionado acidentalmente é incompatível com o exigido na fase 2. Essa hipótese foi descartada por razões lógicas (Hunziker & Gehm, 2010): se um padrão de baixa atividade motora é acidentalmente selecionado pela punição da alta atividade, consequentemente a baixa atividade também seria, de forma acidental, punida e o sujeito voltaria a apresentar maior atividade motora e assim sucessivamente. No presente estudo, todos os sujeitos acoplados emitiram respostas diversas, várias seguidas por estímulos não contingentes. Não foi identificada baixa atividade motora com estímulos apetitivos. Os dados apontam para uma alta atividade motora (Tabela 3.1), possivelmente selecionada acidentalmente por estímulos não contingentes.

Outra interpretação (Hunziker & Gehm, 2010) estabelece que o desamparo será mais ou menos provável, dependendo da contiguidade existente na relação operante na fase 2. Mais provável se houver baixa contiguidade (atraso de reforço) e menos provável se houver alta contiguidade. Considerando que, na fase 2, uma ou três respostas de pressão à barra produziam a liberação de água sem nenhum atraso, a contingência planejada não permitiu avaliar essa interpretação. Pode-se testar experimentalmente essa hipótese em estímulos apetitivos estabelecendo na fase 2 contingências com diferentes atrasos de reforço.

Outra discussão relevante é a utilização de um estímulo consumatório como a água. Como apontaram Capelari e Hunziker (2005), talvez a não ocorrência do mesmo efeito obtido quando se utilizam estímulos aversivos se dê porque com estímulos consumatórios é necessário que o sujeito emita uma resposta para ter acesso, por exemplo, à água (condição de controle sobre o evento), diferentemente de uma condição de incontrolabilidade com choques, na qual o sujeito está com as patas no piso. Contudo, pode-se argumentar que o controle esteja envolvido no consumo de água e não em sua liberação. A visão da água e o som do bebedouro são estímulos incontroláveis. Estudos futuros com estímulos não consumatórios poderiam avaliar essa questão. Na fase 1, por exemplo, uma roda de atividades destravada poderia ser o estímulo reforçador produzido pelo focinhar. Tal resposta dos sujeitos contingentes destravaria a roda de atividades por um tempo estipulado ou até o sujeito completar X voltas. Para os sujeitos não contingentes, o aparato estaria travado e seria liberado quando o sujeito do grupo contingente emitisse a resposta que destrava a roda. Assim, os aspectos metodológicos entre estudos com estímulos aversivos e não aversivos seriam mais bem comparados.

Resolver as questões metodológicas expostas pode também ter implicações em contextos aplicados, nos quais existe a premissa da eficácia do uso de reforçamento não contingente para o tratamento de comportamentos socialmente relevantes (Moore et al., 2016; Phillips et al., 2017; Rooker et al., 2018). Entretanto, essa afirmação deve ser considerada com cautela e não generalizada para todos os casos. Por exemplo, há indícios de que o uso do reforçamento não contingente influenciou a eficácia da aplicação posterior da extinção e a magnitude da ressurgência de comportamentos inadequados (Lambert, Bloom, Samaha, Dayton, & Kunnavatana, 2016) ou a utilização do reforçamento não contingente sem a extinção de comportamentos inadequados produziu ressurgência quando o tratamento foi descontinuado e nenhum reforço disponibilizado (Saini et al., 2017). Em outro estudo, resistência a extinção surgiu em decorrência do emprego de um esquema não contingente sobreposto em uma linha de base de comportamentos inadequados, procedimento por vezes utilizado em contextos aplicados (Lieving, DeLeon, Carreau-Webster, Frank-Crawford, & Triggs, 2018).

Dado semelhante ao mostrado no presente estudo é o de Kelley, Nadler, Rey, Cowie e Podlesnik (2017). Os autores realizaram uma pesquisa translacional averiguando os efeitos do reforçamento não contingente e sua densidade concomitantemente com a aquisição de respostas alternativas ao comportamento dito problemático. Como principal resultado, quanto mais é apresentado o reforço não contingente, mais ocorre a competição do comportamento-alvo com a aquisição e manutenção da resposta alternativa. Esses dados corroboram, em partes, os desta pesquisa, que pareceu mostrar que o fortalecimento de respostas seguidas por estímulos não contingentes competiu, em algum grau, com a resposta de pressão à barra. Embora a variável "densidade de reforço" não tenha sido manipulada, pode ser considerada também em pesquisas futuras. Ainda, parecer haver similaridades no efeito do reforçamento não contingente observado entre estudos básicos e aplicados que necessitam de mais investigações e explicitações, aumentando, assim, a efetividade no desenvolvimento de tecnologias para lidarmos com os comportamentos socialmente relevantes.

5. Considerações finais

O custo da resposta na aquisição do responder operante após a exposição a estímulos apetitivos não contingentes não mostrou resultados conclusivos, pois não há consistências nos dados dos sujeitos não contingentes. A contiguidade entre os eventos na fase 1 pareceu ter selecionado, para alguns sujeitos, respostas que influenciaram o desempenho posterior da fase 2, uma vez que continuaram a ser emitidas. Observou-se que os sujeitos que emitiram um grande número de outras respostas adquiriram a resposta de pressão à barra mais tardiamente que aqueles que emitiram poucas, sugerindo que o atraso reportado em estudos com estímulos apetitivos pode ser gerado por variáveis distintas das que estão relacionadas com o atraso ou não da aquisição da resposta em estudos com estímulos aversivos, os quais apontam para a baixa frequência de respostas por parte dos sujeitos do grupo não contingente.

Estudos realizados com estímulos apetitivos não produziram resultados consistentes. Os dados do presente estudo indicam a importância de analisar a história experimental, incluindo a análise das alterações produzidas no comportamento dos organismos na fase em que são expostos a estímulos não contingentes. Os dados indicam também que nas condições propostas, com os eventos subsequentes apetitivos, um grande número de respostas é emitido pelos sujeitos não contingentes, na fase 1, as quais são possivelmente selecionadas por meio de contiguidades acidentais, mais do que por diminuição na frequência de respostas, relatada em estudos com estímulos aversivos. Pesquisas precisariam avaliar a extensão de tais conclusões.

Alguns refinamentos metodológicos poderiam colaborar para avaliar uma possível generalidade dos efeitos identificados no contexto aversivo para o contexto apetitivo ou para verificar se há uma especificidade em função do tipo de even-to não contingente: 1. mensurar, além das respostas analisadas como variáveis dependentes, outras respostas que podem ocorrer nas fases 1 e 2 que eventualmente se instalam por causa das contiguidades entre eventos não contingentes, visto que a história experimental mantida na primeira fase pode estar relacionada com o desempenho na segunda; 2. utilizar caixas experimentais diferentes entre as duas fases do estudo, buscando minimizar controles do contexto experimental que podem ter sido estabelecidos na história construída na fase anterior; 3. avaliar o tempo de permanência dos possíveis efeitos, quando identificados, na aquisição de nova resposta, aferindo possíveis características dos efeitos produzidos com estímulos aversivos ou com estímulos apetitivos, visto que, quando o efeito é reportado com estímulos aversivos, a duração parece ser mais prolongada do que quando reportado com estímulos apetitivos; 4. utilizar estímulos não consumatórios para que aspectos metodológicos existentes entre os estudos que utilizam estímulos aversivos e não aversivos possam ser comparados.

Referências

Baum, W. M. (2017). Understanding behaviorism: Behavior, culture, and evolution. Malden: Wiley Blackwell. [ Links ]

Beatty, W. W., & Maki, W. S. (1979). Acquisition of instrumental responding following noncontingent reinforcement: Failure to observe learned laziness in rats. Bulletin of the Psychonomic Society, 13,268-271. doi: 10.3758/BF03335079 [ Links ]

Capelari, A., & Hunziker, M. H. L. (2005). Aprendizagem de fuga após exposição a estímulos apetitivos incontroláveis. Psicologia: Teoria e Pesquisa, 21,99-107. [ Links ]

Cardoso, L. A., Britto, I. A. G. S., & Simonassi, L. E. (2016). Comportamento supersticioso em estudantes universitários. Revista Brasileira de Terapia Comportamental e Cognitiva, 18,31-44. doi: 10.31505/rbtcc.v18i1.829 [ Links ]

Engberg, L. A., Hansen, G., Welker, R. L., & Thomas, D. R. (1972). Acquisition of key-pecking via autoshaping as a function of prior experience: "Learned Laziness"? Science, 178, 1002-1004. doi: 10.1126/science.178.4064.1002 [ Links ]

Glazer, H., I., & Weiss, J. M. (1976). Long-term interference effect: An alternative to "learned helplessness. Journal of Experimental Psychology: Animal Behavior Processes, 3,202-213. doi: 10.1037/0097-7403.2.3.202 [ Links ]

Hunziker, M. H. L., & Gehm, T. P. (2010). Uma nova interpretação sobre o desamparo aprendido. In E. Cillo, M. R. Garcia, P. Abreu, & P. Faleiros (Orgs.), Sobre comportamento e cognição (Vol. 23, pp. 352-360). Santo André: ESETec. [ Links ]

Job, R. F. S. (1988). Interference and facilitation produced by noncontingent reinforcement in the appetitive situation. Animal Learning & Behavior, 16,451-460. doi: 10.3758/BF03209386 [ Links ]

Kelley, M. E., Nadler, C. B., Rey, C., Cowie, S., & Podlesnik, C. A. (2017). Noncontingent reinforcement competes with response performance. Journal of the Experimental Analysis of Behavior, 107,343-353. doi: 10.1002/jeab.255 [ Links ]

Lambert, J. M., Bloom, S. E., Samaha, A. L., Dayton, E., & Kunnavatana, S. S. (2016). Effects of noncontingent reinforcement on the persistence and resurgence of mild aggression. The Psychological Record, 66,283-289. doi: 10.1007/s40732-016-0170-7 [ Links ]

Lieving, G. A., DeLeon, I. G., Carreau-Webster, A. B., Frank-Crawford, M. A., & Triggs, M. M. (2018). Additional free reinforcers increase persistence of problem behavior in a clinical context: A partial replication of laboratory findings. Journal of the Experimental Analysis of Behavior, 109,253-264. doi: 10.1002/jeab.310 [ Links ]

Maier, S. F., & Seligman, M. E. P. (2016). Learned helplessness at fifty: Insights from neuroscience. Psychological Review, 123,349-367. doi: 10.1037/rev0000033 [ Links ]

Moore, T. C., Robinson, C. C., Coleman, M. B., Cihak, D. F., & Park, Y. (2016). Noncontingent reinforcement to improve classroom behavior of a student with developmental disability. Behavior Modification, 40,640-657. doi: 10.1177/0145445516629937 [ Links ]

Oakes, W. F., Rosenblum, J. L., & Fox, P. E. (1982). "Manna from heaven": The effect of noncontingent appetitive reinforcers on learning in rats. Bulletin of the Psychonomic Society, 19,123-126. doi: 10.3758/BF03330059 [ Links ]

Phillips, C. L., Iannaccone, J. A., Rooker, G. W., & Hagopian, L. P. (2017). Noncontingent reinforcement for the treatment of severe problem behavior: An analysis of 27 consecutive applications. Journal of Applied Behavior Analysis, 49,1-20. doi: 10.1002/jaba.376 [ Links ]

Rooker, G. W., Bonner, A. C., Dillon, C. M., & Zarcone J. R. (2018). Behavioral treatment of automatically reinforced SIB: 1982-2015. Journal of Applied Behavior Analysis, 51,1-24. doi: 10.1002/jaba.492 [ Links ]

Saini, V., Fisher, W. W., & Pisman, M. D. (2017). Persistence during and resurgence following noncontingent reinforcement implemented with and without extinction. Journal of Applied Behavior Analysis, 50,377-392. doi: 10.1002/jaba.380 [ Links ]

Schwartz, B., Reisberg, D., & Vollmecke, T. (1974). Effects of treadle training on autoshaped keypecking: Learned laziness and learned industriousness or response competition? Bulletin of the Psychonomic Society, 3,369-372. doi: 10.3758/BF03333501 [ Links ]

Skinner, B. F. (1948). "Superstition" in the pigeon. Journal of the Experimental Psychology, 38,168-172. doi: 10.1037/0096-345.121.3.273 [ Links ]

Welker, R. L. (1976). Acquisition of a free operant appetitive response in pigeons as a function of prior experience with response independent food. Learning and Motivation, 7,394-405. doi: 10.1016/0023-9690(76)90045-X [ Links ]

Correspondência:
Carlos Henrique Santos da Silva
Rua Bartira, 387, Perdizes
São Paulo, SP, Brasil. CEP 05009-000
E-mail: rriques@gmail.com

Submissão: 19/07/2019
Aceite: 24/06/2020
Esta pesquisa foi parcialmente financiada pela Capes.

Nota dos autores
Carlos Henrique S. da Silva, Programa de Estudos Pós-Graduados em Psicologia Experimental: Análise do Comportamento (PEXP), Pontifícia Universidade Católica de São Paulo; Nilza Micheletto, Programa de Estudos Pós-Graduados em Psicologia Experimental: Análise do Comportamento (PEXP), Pontifícia Universidade Católica de São Paulo.