Desempenho em FI com humanos: efeito do tipo de reforçador

Costa, Carlos Eduardo; Banaco, Roberto Alves; Becker, Rodrigo Morande

Servicios Personalizados

Articulo

Traducción automática

Indicadores

Accesos

Otros
Otros

Permalink

Temas em Psicologia

versión impresa ISSN 1413-389X

Temas psicol. v.13 n.1 São Paulo 2005

Desempenho em FI com humanos: efeito do tipo de reforçador

Performance in FI with humans: the effect of the type of reinforcer

Carlos Eduardo Costa^I*; Roberto Alves Banaco^II**; Rodrigo Morande Becker^I***

^I Universidade Estadual de Londrina - Brasil
^II Pontifícia Universidade Católica de São Paulo - Brasil

Endereço para correspondência

RESUMO

O estudo investigou o efeito do tipo de reforçador sobre o desempenho humano em FI mantido por pontos. Universitários foram expostos inicialmente a um FI 10s. Subseqüentemente, o FI foi alterado para 5, 20 ou 30s. Pontos foram trocados por fotocópias (Condição 1), por dinheiro (Condição 2) ou não foram trocados por nada (Condição 3). O tipo de reforçador parece ter afetado a probabilidade dos participantes exibirem taxa de respostas alta (participantes da Condição 2-Dinheiro) ou baixa (participantes da Condição 3-Pontos), quando expostos ao FI 10s. Parece ter afetado também a taxa de respostas quando o intervalo do FI mudou. A taxa de respostas da maioria dos participantes mudou nas Condições 1 e 3, quando o intervalo do FI foi alterado, mas permaneceu a mesma para na Condição 2- Dinheiro. Os resultados sugerem que o tipo do reforçador pode favorecer o responder em taxa alta e constante sob FI.

Palavras-chave: Esquemas de reforçamento, Intervalo fixo, Tipo de reforçador, Humanos.

ABSTRACT

The study investigated the effect of the type of reinforcer on human performances in FI maintained by points. University students were exposed initially to a FI 10s reinforcement schedule. Subsequently, the FI parameter was changed to 5, 20 or 30s. To some participants the points were exchanged by photocopies (Condition 1), to others points were exchanged for money (Condition 2), while to others the points were not exchanged (Condition 3). The type of reinforcer seems to affect the participants' probability to exhibit high response rates (Condition 2) or lower rates (Condition 3-points), when exposed to FI 10s. It seems also to have affected response rates when the FI value changed. For most participants the rate of responses on Conditions 1 and 3 changed when the parameter of FI was altered, but remained the same for participants on Condition 2. Results suggest that reinforcer type can favor responding in high and constant rate under FI.

Keywords: Schedules of reinforcement, Fixed interval, Type of reinforcer, Humans.

Uma questão bastante controvertida na literatura da análise experimental do comportamento refere-se à diferença encontrada no padrão do responder entre humanos e não-humanos em programas de reforço, especialmente quando expostos a um programa de reforço em intervalo fixo (FI) (e.g., Lowe, 1979; Matthews, Shimoff, Catania e Sagvolden, 1977; Perone, Galizio & Baron, 1988; Wanchisen, 1990; Wanchisen, Tatham & Mooney, 1989; Weiner, 1983).

Em um programa de reforço em FI a primeira resposta emitida após um período designado de tempo é seguida por um evento reforçador (Catania, 1998; Ferster & Skinner, 1957; Lattal, 1991). Dois padrões de responder sob uma contingência de FI têm sido mais comumente relatados na literatura experimental. Um padrão consiste de uma pausa logo após o reforço, seguida por um responder positivamente acelerado dentro do intervalo até a liberação do próximo reforço. Este padrão tem sido denominado de scallop (Ferster & Skinner). Um outro padrão, denominado break-and-run, consiste de uma pausa, geralmente após o reforço, e uma transição abrupta na taxa de respostas de uma freqüência próxima de zero para uma freqüência constante que é mantida até o final do intervalo (Cumming & Schoenfeld, 1958).

Muita variabilidade entre participantes é encontrada no desempenho de humanos em FI. Alguns estudos experimentais com humanos (Buskist, Miller & Bennett, 1980; Okouchi, 2002; Weiner, 1965, 1969) têm demonstrado que sob um programa de reforço em FI o padrão de responder é, comumente, de taxa de respostas alta e constante; de taxa baixa – muitas vezes de uma a três respostas ou de taxas intermediárias (i.e., taxas relativamente constantes com pouca ou nenhuma pausa). Lowe (1979) defendeu que as diferenças encontradas no padrão de responder de humanos e não-humanos submetidos a programas de FI podem ser devidas ao que o participante humano diz para si mesmo durante o responder sob programas de reforço.

Outros autores (Wanchisen, 1990; Wanchisen & Tatham, 1991; Wanchisen et al., 1989; Weiner, 1969, 1983) defenderam que a diferença nos resultados pode ser devida a diferenças na história de reforço: enquanto humanos têm uma extensa história de condicionamento pré-experimental (inclusive de contato com manipulanda utilizados em experimentos, tais como botões que devem ser pressionados), os animais utilizados nas pesquisas experimentais são, geralmente, ingênuos. Diferenças entre humanos e não-humanos respondendo sob programas de reforço podem ser devidas também às diferenças nos procedimentos empregados nos dois casos (Perone et al., 1988).

Uma diferença marcante entre os estudos experimentais com humanos e não-humanos diz respeito ao tipo de evento reforçador utilizado. A maioria dos experimentos com humanos utiliza algum tipo de reforçador condicional (e.g., pontos, dinheiro, fichas, créditos em curso, etc.), enquanto experimentos com animais geralmente utilizam reforçadores incondicionais (e.g., água, alimento, estimulação elétrica intracraniana, etc.).

Segundo Sidman (1972), a falta de regularidade observada no desempenho de humanos sob programas de reforço – quando comparada a de organismos não-humanos – tem sido evitada quando determinados tipos de reforçadores são empregados, como por exemplo, pequenos objetos de adorno com crianças, doces, moedas, fichas trocáveis por objetos mais valiosos ao final do experimento, cigarro com populações carcerárias, etc.

Isso não significa que o comportamento de organismos não-humanos seja absolutamente estável sob uma contingência de FI. O desempenho de não-humanos sob FI é extremamente sensível a diversas variáveis como, por exemplo, privação, quantidade de reforço, novos estímulos, etc. (Sidman, 1972). Os resultados aparentemente mais regulares encontrados nos estudos com organismos não-humanos provêm de um conjunto de procedimentos-padrão de laboratório que não encontra, até o momento, contrapartida nos estudos com humanos. Variabilidade inexplicável é também comum – e muitas vezes negligenciada – em estudos com organismos não-humanos (Perone et al., 1988).

Os efeitos do tipo de reforçador sobre o desempenho em programas de reforço ainda são escassos e, algumas vezes, discrepantes. Por exemplo, Weiner (1970) apresentou resultados interessantes com relação ao tipo de conseqüência fornecida aos participantes humanos da pesquisa. Os participantes responderam em taxa alta e constante quando submetidos a sessões de FR 40. Quando a contingência mudou de FR para FI 10s-custo¹ a taxa de respostas permaneceu alta. Essa persistência comportamental foi observada tanto para os participantes cujos pontos eram trocados por dinheiro quanto para aqueles que ganhavam apenas os pontos. Mesmo quando o tipo de reforçador variou entre as etapas do estudo, isto é, o tipo de reforçador variou intra-participante e não entre os participantes, o efeito de persistência comportamental foi observado. Esses resultados sugerem que o tipo de reforçador empregado não afeta o efeito da história de reforço em humanos. Apesar disso, é importante notar que nas duas condições os participantes ganhavam U$ 2,00 por sessão.

Todavia, resultados de Costa, Banaco, Longarezi, Martins, Maciel e Sudo (submetido) sugerem que o tipo de reforçador empregado nos estudos sobre os efeitos da história de reforço é uma variável importante para modular os efeitos da história experimental no comportamento de seres humanos. Universitários foram expostos inicialmente a um programa de reforço em FR 40 ou a um programa de reforço em DRL 20s por três sessões de 15 minutos cada. As contingências de reforço foram programadas com o software ProgRef (Costa & Banaco, 2002a; 2002b; 2003) e a conseqüência para a resposta de pressionar um botão era a produção de pontos. Para alguns participantes os pontos eram trocados por fotocópias (Condição 1), para outros os pontos eram trocados por dinheiro (Condição 2), enquanto para outros os pontos não eram trocados por nada (Condição 3). Subseqüentemente, os participantes foram expostos a um programa de reforço em FI 10s por mais três sessões de 15 minutos cada. Os participantes expostos ao FR apresentaram um padrão de responder em taxa alta e constante independentemente do tipo de reforçador utilizado. Quando a contingência mudou de FR para FI a taxa de respostas permaneceu alta para os participantes das Condições 1-Fotocópia e Condição 2-Dinheiro, mas diminuiu para a maioria dos participantes da Condição 3-Pontos. Os participantes expostos inicialmente ao DRL apresentaram um responder em taxa baixa tanto sob a contingência de DRL quanto sob a de FI subseqüente, independentemente do tipo de reforçador. Apesar desse efeito de persistência comportamental, houve um aumento na taxa de respostas quando a contingência mudou (a taxa média de respostas de todos os participantes aumentou de aproximadamente 46 R/min durante o DRL para aproximadamente 70 R/min durante o FI), o que sugere que o responder era controlado também pela contingência de FI presente. Tomados em conjunto, os resultados parecem sugerir também que o comportamento dos participantes estava sob controle tanto da história de reforço quanto da contingência presente e que – diferente dos resultados de Weiner (1970) – o tipo de reforçador empregado pode favorecer a persistência comportamental em FI após exposição a uma contingência de FR.

Outro experimento sugerindo que o tipo de reforçador pode afetar o desempenho de humanos foi o de Ward (1976). Uma criança de sete anos de idade foi submetida a um procedimento para melhorar os movimentos de sua mão esquerda, comprometidos por uma hemiplegia. Era solicitado que ela usasse sua mão esquerda para colocar cubos de madeira dentro de quadrados desenhados em uma folha de papel. O número de respostas corretas pareceu depender da contingência de reforço em vigor (o desempenho foi melhor sob um VR do que sob um FR) e do tipo de reforçador empregado (o desempenho foi melhor quando a conseqüência para respostas corretas era queijo do que quando era um cereal).

O tipo de reforçador parece afetar também a resistência à mudança (momentum comportamental). Mace, Mauro, Boyajian e Eckert (1997 – Experimento 3) treinaram ratos para responder sob um programa de reforço múltiplo VI-VI. Em um dos componentes, uma solução de sacarose era liberada como reforçador enquanto no outro componente um ácido cítrico era o evento reforçador. Em seguida os ratos foram expostos a uma única sessão de extinção em um programa múltiplo EXT-EXT para que se avaliasse a resistência à mudança em cada um dos componentes. Durante a exposição ao múltiplo VI-VI os ratos tenderam a responder em taxas aproximadamente iguais nos dois componentes. Entretanto, a proporção de respostas durante a Extinção na presença do estímulo correlacionado anteriormente com o reforçador sacarose foi maior do que a proporção de respostas na presença do estímulo anteriormente correlacionado com o ácido cítrico. Portanto, o tipo de reforçador pareceu afetar a resistência à mudança durante a extinção.

Tendo em vista que poucos estudos experimentais manipularam diretamente o tipo de reforçador empregado para avaliar os efeitos sobre o comportamento humano em programas de reforço, o presente experimento procurou investigar especificamente se o tipo de reforçador (pontos, pontos trocáveis por dinheiro e pontos trocáveis por fotocópias) produziria algum efeito sobre o desempenho de humanos respondendo em um programa de FI.

Método

Participantes

Participaram do experimento 11 universitários, de ambos os sexos (oito homens e três mulheres), da Universidade Estadual de Londrina. Nenhum dos participantes era do curso de Psicologia. Os participantes S32 e S34 pertenciam à mesma turma de um mesmo curso. Apesar de ser solicitado aos participantes que não conversassem com outras pessoas sobre as sessões experimentais nenhum tipo de controle foi realizado a esse respeito. Todos os participantes assinaram um Termo de Consentimento Livre e Esclarecido para participação do experimento. O projeto foi submetido e aprovado pelo Comitê de Ética em Pesquisas com Seres Humanos da Universidade Estadual de Londrina.

Equipamentos e Instrumentos

Equipamentos: Foram utilizados três microcomputadores do tipo PC com monitor de 14 polegadas, mouse e teclado padrão e Windows® 95 e 98se.

Instrumentos: Foram utilizados os softwares ProgRef v2 (Costa & Banaco, 2002a) e ProgRef v3 (Costa & Banaco, 2002b, 2003). Testes realizados antes do início do procedimento experimental revelaram que não havia qualquer diferença detectável no desempenho do software entre os três microcomputadores e versões do Windows® (95 e 98se) utilizados.

Os participantes deviam clicar com o cursor do mouse sobre um botão de resposta (retângulo) que aparecia no monitor. Os pontos apareciam em um retângulo escuro com números em azul ou branco acima do botão de resposta (visor de pontuação) e eram apresentados de acordo com o programa de reforço selecionado pelo experimentador. Quando o participante ganhava algum ponto aparecia um ícone identificado comumente como um smile no canto superior direito do monitor. O participante devia, então, dirigir o cursor do mouse sobre o botão que se localizava no canto superior direito da tela, acima desse ícone (botão da resposta de consumação) e clicar o mouse. Ao fazer isso o smile desaparecia e o ponto era creditado no contador. Enquanto um smile estivesse presente no monitor, respostas adicionais emitidas no botão de resposta não eram seguidas por novas apresentações do smile até que o participante clicasse no botão da resposta de consumação. Entretanto, caso o participante continuasse a clicar sobre o botão de respostas após o aparecimento do smile, as respostas eram registradas. Os cronômetros que controlavam a execução do software continuavam em operação durante todo o experimento. Portanto, o tempo consumido pelo participante para dirigir o cursor do mouse sobre o botão de resposta de consumação e clicá-lo era computado como parte do intervalo entre reforços. O intervalo de um FI, por exemplo, era iniciado a partir do aparecimento do smile (liberação do reforço) e não a partir da resposta de consumação.

Local

As sessões experimentais foram realizadas em duas salas do Departamento de Psicologia Geral e Análise do Comportamento do Centro de Ciências Biológicas da Universidade Estadual de Londrina. A Sala 1 tinha aproximadamente 20 m² na qual ficavam os Computadores 1 e 3. Entretanto, apenas um participante era colocado na sala por vez. A Sala 2 era uma sala de aula e tinha aproximadamente 75 m² na qual ficava o Computador 2.

Reforçadores

Foram utilizados como reforçadores: (1) pontos trocáveis por dinheiro, (2) pontos trocáveis por fotocópias ou (3) pontos apenas. Maiores detalhes dos tipos de reforçadores são fornecidos na descrição das condições experimentais no Procedimento.

Procedimento

Antes do início da primeira sessão, o participante lia e assinava o Termo de Consentimento Livre e Esclarecido. Ao adentrar pela primeira vez a sala onde era realizado o experimento o participante lia as seguintes instruções impressas em uma folha:

Obrigado por sua colaboração! Sua tarefa será clicar com o botão esquerdo do mouse sobre um retângulo que aparece na parte inferior do monitor para obter pontos. Abaixo você pode observar o layout da tela. [Uma figura com o desenho da tela era apresentada]. Você deve tentar ganhar o maior número de pontos que você conseguir. Você ganhará pontos clicando sobre o botão de uma maneira específica. Os pontos aparecerão na janela que se localiza na parte superior da tela na posição central. Entretanto, quando você ganhar algum ponto aparecerá no canto superior direito do monitor um smile. Você deverá, então, clicar com a seta do mouse sobre o botão que se localiza no canto superior direito da tela. Ao fazer isso o smile desaparecerá e o ponto será creditado no contador. Quando um smile aparecer no monitor não aparecerá outro até que você clique no botão menor no canto superior direito. Depois que o smile desaparece – e o ponto é creditado – você pode voltar a clicar sobre o botão maior na parte inferior do monitor para ganhar mais pontos. Boa sorte!

Em seguida, era solicitado que o participante deixasse todo seu material, inclusive relógio, sobre uma mesa distante (a pelo menos 2 metros) do computador no qual ele trabalharia. Também era solicitado que o participante desligasse seu celular, caso estivesse portando algum. A Tabela 1 esquematiza o procedimento experimental.

Tabela 1. Sumário do procedimento experimental.

Condição 1. Fotocópia: os participantes recebiam, ao final de cada sessão, um crédito de uma fotocópia no Centro Acadêmico do curso de Psicologia para cada ponto obtido nas sessões. À época do experimento cada fotocópia custava R$ 0,05. Os participantes podiam gastar o crédito em fotocópias a qualquer momento após a sessão.

Condição 2. Dinheiro: os participantes recebiam, ao final de cada sessão, R$ 0,05 para cada ponto obtido na sessão.

Condição 3. Pontos: os participantes ganhavam apenas os pontos obtidos em cada sessão.

Treino da resposta experimental. Durante o treino todos os participantes tinham como conseqüência programada pelo seu desempenho apenas os pontos. Somente a partir da Etapa 1 as conseqüências programadas foram aquelas descritas anteriormente. Imediatamente após a leitura da instrução os participantes foram submetidos a uma sessão de treinamento do comportamento de pressionar o botão do mouse sob um programa de reforço em FI. Este treino consistiu de várias exposições curtas à contingência de reforço com o intervalo do FI aumentando paulatinamente. Os participantes foram expostos a um FI 5, 7, 8 e 10s, nessa ordem. No final de cada período de três minutos uma mensagem aparecia na tela do computador informando ao participante quantos pontos ele havia obtido e que ele deveria chamar o experimentador. O experimentador entrava na sala e programava as contingências para o próximo período de três minutos de exposição ao FI. Nenhum outro critério, a não ser o tempo de três minutos de exposição foi utilizado para a mudança dos valores do intervalo.

Etapa 1. Os participantes eram expostos a três sessões de 15 minutos cada sob FI 10s. Sob esta contingência, a primeira resposta que ocorresse após um intervalo de 10 segundos desde o reforço prévio (ou do início da sessão) era seguida pelo aparecimento do smile. Após o aparecimento do smile, uma pressão no botão de resposta de consumação era seguida pelo desaparecimento do smile e um ponto era creditado no visor de pontuação.

Etapa 2. Os participantes foram submetidos a um de três parâmetros do FI: FI 5s, FI 20s, ou FI 30s. A modificação nos parâmetros do FI alterava a taxa de reforços. Foram realizadas nesta etapa três sessões de 15 minutos.

A cor do botão de respostas mudou entre as Etapas 1 e 2. As sessões experimentais eram realizadas de segunda à sexta-feira (exceto feriados) – pelo menos duas vezes por semana – no período das 08:00 às 18:00 horas, de acordo com a disponibilidade dos participantes.

Resultados

A Figura 1 exibe a freqüência acumulada de pressão ao botão dos participantes da Condição 1-Fotocópia nas três sessões de exposição ao programa de reforço em FI 10s. Exibe também a taxa geral de respostas (R/min) e a taxa geral de reforços (pontos/min) de cada sessão.

Figura 1. Freqüência acumulada de pressão ao botão dos participantes S8, S9 e S10 na Condição 1 – Fotocópia nas três sessões de exposição a um programa de reforço em FI 10s. Os registros cumulativos voltam a zero após 250 respostas e as marcas diagonais nos registros indicam a ocorrência de reforço. Todas as sessões tiveram duração de 15 minutos. O número entre colchetes [ ], acima de cada registro cumulativo, indica a taxa geral de respostas na sessão e o número entre parênteses ( ) indica a taxa geral de reforços (pontos) na sessão.

Observa-se na Figura 1 que os desempenhos dos participantes foram diferentes entre si ao longo das três sessões de exposição do FI 10s. O desempenho do participante S9 foi o que sofreu maior alteração da primeira para a terceira sessão do FI 10s. Pode-se observar que por volta do 10º minuto da segunda sessão (seta no registro cumulativo da 2ª sessão de FI do participante S9 na Figura 1) o desempenho do S9 começa a mudar de um padrão de responder em taxa alta para um padrão que alternava taxa de respostas baixa e alta. O desempenho final na última sessão de exposição ao FI 10s do participante S9 foi de taxa relativamente baixa (cerca de 71% mais baixa que a taxa geral da primeira sessão). O participante S8 não alterou substancialmente a taxa de respostas da primeira para a terceira sessão de exposição ao FI 10s. A taxa de respostas do participante S10 aumentou da primeira para a terceira sessão do FI 10s e foi muito superior à do participante S8 (cuja taxa de respostas no final da terceira sessão do FI 10s foi mais próxima à do S9). A redução na taxa de respostas (com manutenção na taxa de reforços) observada entre o 2º e o 3º minuto da segunda sessão do participante S10 (seta na 2ª sessão de S10 na Figura 1) não foi mantida por este participante.

A Figura 2 exibe a freqüência acumulada de pressão ao botão dos participantes da Condição 2-Dinheiro nas três sessões de exposição ao programa de reforço em FI 10s. A taxa geral de respostas (R/min) e a taxa geral de reforços (pontos/min) de cada sessão são mostradas na parte superior de cada registro cumulativo.

Figura 2. Freqüência acumulada de pressão ao botão dos participantes S18, S19 e S20 na Condição 2 – Dinheiro nas três sessões de exposição a um programa de reforço em FI 10s. Os registros cumulativos voltam a zero após 250 respostas e as marcas diagonais nos registros indicam a ocorrência de reforço. Todas as sessões tiveram duração de 15 minutos. O número entre colchetes [ ], acima de cada registro cumulativo, indica a taxa geral de respostas na sessão e o número entre parênteses ( ) indica a taxa geral de reforços (pontos) na sessão.

O padrão de alta taxa de respostas dos três participantes da Condição 2-Dinheiro manteve-se relativamente constante entre a primeira e a terceira sessões de exposição ao FI 10s, conforme pode ser verificado na Figura 2. Não houve pausa pós-reforço, isto é, o responder entre reforços consecutivos foi relativamente constante.

A Figura 3 exibe a freqüência acumulada de pressão ao botão dos participantes da Condição 3-Pontos nas três sessões de exposição ao programa de reforço em FI 10s. A taxa geral de respostas (R/min) e a taxa geral de reforços (pontos/min) de cada sessão são mostradas na parte superior de cada registro cumulativo.

Figura 3. Freqüência acumulada de pressão ao botão dos participantes S32, S33, S34, S35 e S36 na Condição 3 – Pontos nas três sessões de exposição a um programa de reforço em FI 10s. Os registros cumulativos voltam a zero após 250 respostas e as marcas diagonais nos registros indicam a ocorrência de reforço. Todas as sessões tiveram duração de 15 minutos. O número entre colchetes [ ], acima de cada registro cumulativo, indica a taxa geral de respostas na sessão e o número entre parênteses ( ) indica a taxa geral de reforços (pontos) na sessão.

Verifica-se na Figura 3 que os desempenhos dos participantes S33 e S36 foram semelhantes entre si na maior parte das três sessões de exposição ao FI 10s, isto é, um padrão de responder em taxa alta. A suave diminuição na taxa de respostas ocorrida na primeira sessão de S33 (letra f na Figura 3) e S36 (letra m da Figura 3) não foram mantidas posteriormente. Os participantes S32 e, principalmente, S35 emitiram taxas de respostas relativamente menores que os participantes S33 e S36 nas duas sessões iniciais do FI 10s, mas mesmo assim o desempenho foi de taxa alta (taxa geral de respostas acima de 70 R/min). Na terceira sessão de exposição ao FI 10s, o participante S32 emitiu um padrão de responder relativamente alto e constante, intercalado com alguns padrões de responder em taxa mais baixa (letras a, b, c e d na Figura 3); por volta do 12º minuto (letra e na Figura 3) o padrão tornou-se mais consistentemente de baixa taxa, semelhante ao desempenho final dos participantes S34 e S35. Um padrão de responder em taxa baixa foi observado no desempenho do participante S35 (a partir do 5º minuto, marcado com a letra l na Figura 3). O desempenho do participante S34 foi, de maneira geral, semelhante ao do participante S35: taxa alta na primeira sessão e taxa relativamente baixa na terceira sessão do FI 10s. Entretanto, o participante S34 apresentou diminuição na taxa já na primeira sessão do FI (letra g na Figura 3) e manteve esse padrão apesar da taxa de respostas ocasionalmente mais alta nas duas sessões seguintes (por exemplo, letras h, i e j).

Em resumo, de maneira geral, os participantes de todas as condições de reforço exibiram um padrão inicial de responder em taxa alta. Os registros cumulativos sugerem que a mudança do responder de taxa alta para taxa baixa não ocorreu abruptamente após uma diminuição isolada e ocasional na taxa de respostas entre reforços sucessivos. Aparentemente, ocorreu uma alternação entre um responder em taxa alta e baixa até que um responder em taxa baixa e constante fosse enfim selecionado, como pode ser observado, por exemplo, no registro cumulativo da 2ª sessão de FI do participante S9 a partir da seta, na Figura 1; e a partir da marca a (S32) e em k (S35), na Figura 3.

Por fim, os participantes que exibiram um responder em taxa relativamente mais baixa obtiveram um número um pouco menor de pontos ganhos. Os participantes da Condição 2-Dinheiro emitiram, em média, a maior taxa de respostas (205,8 R/min) e também obtiveram, em média, um número um pouco maior de pontos ganhos (dois pontos mais na média total ou um incremento de 0,1 ponto por minuto na taxa de reforços).

Desempenho após a mudança no parâmetro da contingência de FI 10s para FI 5, 20 ou 30s.

O intervalo do FI 10s foi manipulado. Em dois casos ele foi ampliado de 10 segundos para 20 ou 30 segundos e em outro caso o intervalo foi reduzido de 10 segundos para 5 segundos. Estas mudanças tendem a produzir diferentes desempenhos em FI. Espera-se que a taxa geral de respostas continue alta (ou mesmo aumente) após a redução do intervalo no FI (por exemplo, no presente estudo, de 10 segundos para 5 segundos), uma vez que a taxa de reforço é aumentada. Todavia, quando o intervalo aumenta (por exemplo de 10 segundos para 20 ou 30 segundos), espera-se que a taxa geral de respostas diminua e, eventualmente, pausas pós-reforço possam aparecer (especialmente no intervalo mais longo – 30 segundos).

A Figura 4 exibe a freqüência acumulada de pressão ao botão dos participantes da Condição 1-Fotocópia na terceira sessão de exposição ao programa de reforço em FI 10s e nas três sessões de reforço em FI 5s (S8), FI 20s (S9) e FI 30s (S10). A taxa geral de respostas (R/min) e a taxa geral de reforços (pontos/min) de cada sessão são mostradas na parte superior de cada registro cumulativo.

Figura 4. Freqüência acumulada de pressão ao botão dos participantes S8, S9 e S10 na Condição 1 – Fotocópia na terceira sessão de exposição a um programa de reforço em FI 10s (primeira coluna da esquerda) e nas três sessões de exposição a um programa de reforço em FI 5, 20 ou 30s. O intervalo específico do FI de cada participante é indicado no canto esquerdo superior do registro da primeira sessão de mudança, na segunda coluna da esquerda para a direita. Os registros cumulativos voltam a zero após 250 respostas e as marcas diagonais nos registros indicam a ocorrência de reforço. Todas as sessões tiveram duração de 15 minutos. O número entre colchetes [ ], acima de cada registro cumulativo, indica a taxa geral de respostas na sessão e o número entre parênteses ( ) indica a taxa geral de reforços (pontos) na sessão.

Observa-se na Figura 4 que o participante S10, que exibia um padrão de responder em taxa alta e relativamente constante entre reforços sucessivos durante a exposição ao FI 10s, manteve o mesmo padrão de responder em taxa alta quando o parâmetro do FI foi mudado. O comportamento do participante S8 alterou-se apenas na última sessão de exposição ao FI 5s. A taxa geral de respostas passou de 32,6 R/min na 3ª sessão do FI 10s para 38,9 R/min na 3ª sessão de exposição ao FI 5s. Apesar da taxa geral de respostas não mudar substancialmente, o participante S9 passou a exibir pausas maiores no meio do intervalo entre reforços quando o parâmetro do FI passou de 10 para 20 segundos. De maneira geral, a mudança no intervalo do FI – com a conseqüente mudança na taxa de reforços – não alterou substancialmente o desempenho dos participantes da Condição 1-Fotocópias.

A Figura 5 exibe a freqüência acumulada de pressão ao botão dos participantes da Condição 2-Dinheiro na terceira sessão de exposição ao programa de reforço em FI 10s e nas três sessões de reforço em FI 5s (S18), FI 20s (S19) e FI 30s (S20). A taxa geral de respostas (R/min) e a taxa geral de reforços (pontos/min) de cada sessão são mostradas na parte superior de cada registro cumulativo.

Figura 5. Freqüência acumulada de pressão ao botão dos participantes S18, S19 e S20 na Condição 2 – Dinheiro na terceira sessão de exposição a um programa de reforço em FI 10s (primeira coluna da esquerda) e nas três sessões de exposição a um programa de reforço em FI 5, 20 ou 30s. O intervalo específico do FI de cada participante é indicado no canto esquerdo superior do registro da primeira sessão de mudança, na segunda coluna da esquerda para a direita. Os registros cumulativos voltam a zero após 250 respostas e as marcas diagonais nos registros indicam a ocorrência de reforço. Todas as sessões tiveram duração de 15 minutos. O número entre colchetes [ ], acima de cada registro cumulativo, indica a taxa geral de respostas na sessão e o número entre parênteses ( ) indica a taxa geral de reforços (pontos) na sessão.

Verifica-se na Figura 5 que os participantes cujos pontos eram trocados por dinheiro exibiam um padrão de responder em taxa alta na terceira sessão de exposição ao programa de FI 10s (primeira coluna à esquerda) e mantiveram esse mesmo padrão de responder quando o parâmetro temporal do FI foi alterado. Nesse sentido, embora a taxa de respostas entre os participantes seja divergente, os resultados são semelhantes aos dos participantes da Condição 1-Fotocópias uma vez que a alteração no intervalo do FI não produziu mudanças substanciais na taxa de respostas.

A Figura 6 exibe a freqüência acumulada de pressão ao botão dos participantes da Condição 3-Pontos na terceira sessão de exposição ao programa de reforço em FI 10s e nas três sessões de reforço em FI 5s (S32), FI 20s (S33, S34 e S35) e FI 30s (S36). A taxa geral de respostas (R/min) e a taxa geral de reforços (pontos/min) de cada sessão são mostradas na parte superior de cada registro cumulativo.

Figura 6. Freqüência acumulada de pressão ao botão dos participantes S32, S33, S34, S35 e S36 na Condição 3 – Pontos na terceira sessão de exposição a um programa de reforço em FI 10s (primeira coluna da esquerda) e nas três sessões de exposição a um programa de reforço em FI 5, 20 ou 30s. O intervalo específico do FI de cada participante é indicado no canto esquerdo superior do registro da primeira sessão de mudança, na segunda coluna da esquerda para a direita. Os registros cumulativos voltam a zero após 250 respostas e as marcas diagonais nos registros indicam a ocorrência de reforço. Todas as sessões tiveram duração de 15 minutos. O número entre colchetes [ ], acima de cada registro cumulativo, indica a taxa geral de respostas na sessão e o número entre parênteses ( ) indica a taxa geral de reforços (pontos) na sessão.

É possível observar na Figura 6 que os participantes da Condição 3-Pontos que exibiram um padrão de responder em taxa alta e constante durante a terceira sessão de exposição ao FI (S33 e S36) mantiveram o mesmo padrão de responder até a terceira sessão após a mudança no parâmetro temporal do FI, mesmo com a redução na taxa de reforços. O comportamento dos participantes S32, S34 e S35 parecia sob controle do parâmetro temporal do FI 10s. Esses participantes alteraram o padrão de responder quando o parâmetro temporal do FI foi alterado, conforme se pode observar na terceira sessão de exposição ao FI na última coluna da direita. Uma diminuição gradual na taxa de respostas em sessões consecutivas, com pausas no meio dos intervalos entre reforços, é observada nos registros dos participantes S34 e S35 cujo parâmetro temporal do FI mudou de 10 para 20 segundos.

Conforme descrito anteriormente, o participante S32 manteve um padrão de responder em taxa relativamente alta, com pequenos períodos de taxas mais baixas, até o 13º minuto da terceira sessão em FI 10s e nos dois últimos minutos o padrão passou a ser de taxa baixa (o responder parece ter ficado sob controle do parâmetro temporal da contingência de FI 10s). Embora o padrão de responder desse participante no primeiro minuto da primeira sessão de exposição ao FI 5s (registro da segunda coluna da esquerda para a direita na Figura 6) tenha sido novamente de taxa alta, há uma diminuição na taxa de respostas até a terceira sessão. No caso desse participante (S32) não é possível afirmar que a mudança no desempenho tenha sido devida à mudança no parâmetro temporal do FI. O registro cumulativo, na terceira sessão de exposição ao FI 5s (última coluna da direita na Figura 6), sugere que seu comportamento estava sob controle do parâmetro temporal do FI em vigor, mas não parece que seu comportamento tenha sido alterado com a mudança do parâmetro temporal do FI de 10 para 5 segundos. Na verdade, os registros sugerem que seu comportamento ficou cada vez mais sob o controle do FI 10s, mas antes que a relação entre o desempenho e a contingência programada de FI tivesse completamente estabelecida (i.e., o desempenho estivesse estável) a contingência foi alterada para um FI 5s. O processo de interação entre o desempenho e a contingência programada parece ter continuado, agora sob o FI 5s e o controle pela contingência presente parecia mais fortemente estabelecido na última sessão sob FI 5s.

Esta cautela na interpretação dos resultados do participante S32 é necessária já que os participantes foram expostos à primeira condição experimental por um número fixo de sessões (três sessões sob FI 10s). O comportamento de alguns dos participantes – em que o S32 é o caso mais evidente – não estava estável para que se pudesse avaliar com maior precisão o efeito das mudanças experimentais – neste caso a mudança no parâmetro temporal do FI de 10 para 5 segundos.

Discussão

Quando participantes do presente experimento foram expostos a uma contingência de FI 10s, padrões de responder tanto em taxa alta como em taxa baixa, como aqueles obtidos por Buskist et al. (1980); Okouchi (2002) e Weiner (1969), foram observados entre os participantes cujos pontos eram trocados por fotocópias (Condição 1) e cujos pontos não eram trocados por nada (Condição 3). Os participantes cujos pontos eram trocados por dinheiro (Condição 2) exibiram apenas responder em taxas altas. O fato do responder em taxa alta também ocorrer com participantes da Condição 1-Fotocópias (e.g., S10 – ver Figura 1 e 4) e da Condição 3-Pontos (e.g., S33 e S36 – ver Figura 3 e 6) sugere que o tipo de reforçador não é a única variável que favorece um responder em taxa alta sob FI com humanos.

A maioria dos participantes, das três condições de reforço, iniciou as sessões experimentais emitindo um padrão de responder em altas taxas. Pode-se especular que, talvez, isso tenha ocorrido devido (a) à facilidade (ou baixo custo) da resposta operante estudada (ver Weiner, 1962; 1965 para uma discussão sobre o efeito do custo da resposta com humanos); (b) às instruções experimentais fornecidas aos participantes. Em linhas gerais, as instruções do presente experimento diziam que era necessário pressionar o botão de alguma maneira específica para ganhar o maior número de pontos possíveis. Na ausência de contato com as contingências experimentais esta instrução por si só pode ter aumentado a probabilidade de que um responder em taxa alta fosse emitido. Com a exposição continuada à contingência de FI, alguns participantes diminuíram a taxa de respostas enquanto outros a mantiveram alta; e (c) à história extra-experimental de pressionar botões (inclusive de pressionar o botão do mouse com o cursor sobre um botão que aparece na tela de um computador). Essas alternativas parecem igualmente prováveis e não são mutuamente excludentes.

Ao responder em taxas altas sob FI 10s os participantes do presente experimento obtiveram quase todos os pontos disponíveis na sessão. O FI não tem características de programação que selecione apenas responder em taxa baixa, como no caso de uma contingência de DRL, ou que estabeleça uma forte correlação entre a taxa de respostas e a taxa de reforço, como nas contingências de razão. Uma das características do programa de FI é que ele possibilita uma faixa ilimitada de números de respostas por reforçador em intervalos sucessivos, apesar da dependência resposta-reforçador envolver apenas uma resposta (Lattal, 1991; Zeiler, 1977). Portanto, o responder em taxa alta sob FI 10s não parece ser, per se, indicativo suficiente que autorize uma interpretação de que o comportamento desses participantes era insensível às contingências de reforço.

A alteração no parâmetro do FI de 10 para 5, 20 ou 30 segundos não foi suficiente para alterar o padrão de responder em taxa alta dos participantes da Condição 2-Dinheiro (Figura 7) e dos participantes S10 (da Condição 1-Fotocópias – Figura 6) e S33 e S36 (da Condição 3-Pontos – Figura 8). A alteração no parâmetro temporal do FI, entretanto, continuava não impondo nenhuma restrição sobre o responder em taxa alta entre reforços sucessivos (i.e., o comportamento dos participantes continuava a ser reforçado mesmo quando o responder era em altas taxas). De modo a testar a sensibilidade do comportamento dos participantes à contingência de reforço corrente seria preciso alterar a contingência, por exemplo, de FI 10s para DRL 10s. A contingência de DRL imporia uma forte restrição sobre o responder em altas taxas.

O comportamento do participante S9 (da Condição 1-Fotocópia) e dos participantes S34 e S35 (da Condição 3-Pontos) pareceram sensíveis à mudança no parâmetro temporal do FI de 10 para 20 segundos. O aumento no intervalo do FI resultou no aparecimento de pausas maiores durante o intervalo entre reforços (S9, S34 e S35). Um pequeno aumento na taxa de respostas foi também observado no desempenho do participante S8 (Condição 1-Fotocópias) quando se compara a taxa geral de respostas da última sessão do FI 10s com a última sessão do FI 5s. A condição 2-Dinheiro foi a que produziu maior resistência à mudança no padrão comportamental dos participantes.

Em suma, os resultados do presente estudo sugerem que o desempenho inicial de humanos expostos a um programa de FI é de alta taxa de respostas. A condição para que um padrão em baixa taxa seja selecionado é que ele seja emitido. Os pontos trocados por dinheiro parecem diminuir a probabilidade de que os participantes reduzam a taxa de respostas durante a sessão para que, então, um novo padrão de responder possa ser selecionado. Em outras palavras, pontos trocados por dinheiro parecem favorecer o responder em taxa alta e constante sob FI. Padrões de taxa alta e constante também foram observadas no desempenho dos participantes das outras duas condições, o que sugere que o tipo de reforçador não é a única variável que favorece a emergência de um responder constante e em taxas altas sob FI.

Apesar da persistência de responder em alta taxa para os participantes da Condição 2-Dinheiro, seria interessante aumentar o número de sessões a fim de verificar se este padrão persistiria por mais sessões do que aquelas realizadas no presente estudo. Além disso, outras variações de procedimento (cf. Matthews et al., 1977; Perone et al. 1988) poderiam ser testadas de modo isolado ou em conjunto, tais como, o tempo de duração de cada sessão, o tipo de instrução fornecida aos participantes, a presença ou ausência de uma resposta de consumação.

Referências

Buskist, W. F., Miller, H. L., Bennett, R. H. (1980). Fixed-interval performance in humans: Sensitivity to temporal parameters when food is the reinforcer. Psychological Record, 30 (1), 111-121. [ Links ]

Catania, A. C. (1998). Learning (4ª ed.). New Jersey: Prentice Hall. [ Links ]

Costa, C. E. & Banaco, R. A. (2002a). ProgRef v2: um software para o estudo de programas de reforço com humanos (pp. 235). In Anais, XI Encontro Brasileiro de Psicoterapia e Medicina Comportamental. Londrina, PR: Associação Brasileira de Psicoterapia e Medicina Comportamental. [ Links ]

Costa, C. E. & Banaco, R. A. (2002b). ProgRef v3: sistema computadorizado para coleta de dados sobre programas de reforço com humanos - recursos básicos. Revista Brasileira de Terapia Comportamental e Cognitiva, 4 (2), 173-192. [ Links ]

Costa, C. E. & Banaco, R. A. (2003). ProgRef v3: sistema computadorizado para coleta de dados sobre programas de reforço com humanos - recursos adicionais. Revista Brasileira de Terapia Comportamental e Cognitiva, 5 (2), 219-229. [ Links ]

Costa, C. E., Banaco, R. A., Longarezi, D. M., Martins, E. M., Maciel, E. M., Sudo, C. H. (submetido). Tipo de reforçador como variável moduladora dos efeitos da história em humanos. Artigo não publicado submetido à revista Psicologia: Teoria e Pesquisa. [ Links ]

Cumming, W. W. & Schoenfeld, W. N. (1958). Behavior under extended exposure to a high-value fixed interval reinforcement schedule. Journal of the Experimental Analysis of Behavior, 1, 245-263. [ Links ]

Ferster, C. B., & Skinner, B. F. (1957). Schedules of Reinforcement. New York: Appleton Century Crofts. [ Links ]

Lattal, K. A. (1991). Scheduling positive reinforcers. In I. H. Iversen e K. A. Lattal (Eds.), Experimental Analysis of Behavior, Part 1. (pp. 87-134). New York, NY: Elsevier Science. [ Links ]

Lowe, C. F. (1979). Determinants of human operant behaviour. In M. D. Zeiler e P. Harzem (Eds.), Reinforcement and the Organization of Behavior. (pp. 159-192). New York, NY: John, Wiley & Sons. [ Links ]

Mace, F. C., Mauro, B., Boyajian, A. E., Eckert, T. L. (1997). Effects of reinforcer quality on behavioral momentum: Coordinated applied and basic research. Journal of Applied Behavior Analysis, 30 (1), 1-20. [ Links ]

Matthews, B. A., Shimoff, E., Catania, A. C., Sagvolden, T. (1977). Uninstructed human responding: sensitivity to ratio and interval contingencies. Journal of the Experimental Analysis of Behavior, 27 (3), 453-467. [ Links ]

Okouchi, H. (2002). Individual differences in human fixed-interval performance. Psychological Record, 52 (2), 173-186 [ Links ]

Perone, M.; Galizio, M., Baron, A. (1988). The relevance of animal-based principles in the laboratory study of human operant conditioning. In G. Davey e C. Cullen (Eds.), Human operant conditioning and behavior modification. (pp. 59-85). Chichester, England: John Willey & Sons. [ Links ]

Sidman, M. (1972). Técnicas operantes (D. M. Leite, Trans.). In A. J. Bachrach (Ed.), Fundamentos Experimentais da Psicologia Clínica. (pp. 215-266). São Paulo: Herder/EDUSP. [ Links ]

Wanchisen, B. A. (1990). Forgetting the lessons of history. Behavior Analyst, 13 (1), 31-37. [ Links ]

Wanchisen, B. A. & Tatham, T. A. (1991). Behavioral history: A promising challenge in explaining and controlling human operant behavior. Behavior Analyst, 14 (2), 139-144. [ Links ]

Wanchisen, B. A., Tatham, T. A., Mooney, S. E. (1989). Variable-ratio conditioning history produces high- and low-rate fixed-interval performance in rats. Journal of the Experimental Analysis of Behavior, 52 (2), 167-179. [ Links ]

Ward, J. (1976). Variation of reinforcement in performance of a motor skill. Perceptual and Motor Skills, 43, 149-150. [ Links ]

Weiner, H. (1962). Some effects of response cost upon human operant behavior. Journal of the Experimental Analysis of Behavior, 5 (2), 201-208. [ Links ]

Weiner, H. (1965). Conditioning history and maladaptative human operant behavior. Psychological Reports, 17 (3), 935-942. [ Links ]

Weiner, H. (1969). Controlling human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 12 (3), 349-373. [ Links ]

Weiner, H. (1970). Human behavioral persistence. Psychological Record, 20 (4), 445-456. [ Links ]

Weiner, H. (1983). Some thoughts on discrepant human-animal performances under schedules of reinforcement. Psychological Record, 33 (4), 521-532. [ Links ]

Zeiler, M. (1977). Schedules of reinforcement: the controlling variables. In W. K. Honig e J. E. R. Staddon (Eds.), Handbook of Operant Behavior. (pp. 201-232). New Jersey: Prentice Hall. [ Links ]

Endereço para correspondência
Carlos Eduardo Costa
Rua da lapa, 498 – Apto 101 - Jardim Higienópolis
86015-050 – Londrina – PR
(0XX43) 3371-4227 e (0XX43) 9928-3335
e-mail: caecosta@uel.br

^* Este artigo é parte da Tese de Doutorado em Psicologia Experimental do primeiro autor apresentada ao Instituto de Psicologia da USP-SP em 2004. O autor é professor do Departamento de Psicologia Geral e Análise do Comportamento e do Programa de Mestrado em Análise do Comportamento da Universidade Estadual de Londrina. Endereço eletrônico: caecosta@uel.br.
^** Professor Titular do Departamento de Métodos e Técnicas da Faculdade de Psicologia da Pontifícia Universidade Católica de São Paulo; Programa de Estudos Pós-graduados em Psicologia Experimental: Análise do Comportamento. Endereço eletrônico: rbanaco@terra.com.br.
^*** Discente do curso de graduação em Psicologia da Universidade Estadual de Londrina.
¹Sob uma contingência de FI 10s-custo os participantes recebiam 100 pontos para a primeira resposta emitida após um intervalo de 10s e perdiam um ponto para cada resposta emitida durante o intervalo entre reforços.