SciELO - Scientific Electronic Library Online

 
vol.3 número3Cronometría de processos mentaisO papel da nomeação na formação de classes equivalentes de estímulos índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Temas em Psicologia

versão impressa ISSN 1413-389X

Temas psicol. vol.3 no.3 Ribeirão Preto dez. 1995

 

Motivação e análise do comportamento(1)

 

 

Rachel Nunes da Cunha

Universidade de Brasília. Instituto de Psicologia. Universidade de Brasília Campus Universitário - Asa Norte 70910-900 - Brasília - DF Tel.:(061) 348-2625 Internet: rdacunha@guarany.cpd.unb.br

 

 

O objetivo deste texto é o de apresentar a proposta teórica de Jack Michael (Michael, 1982,1993) que define motivação como operações estabelecedoras, e descrever procedimentos experimentais que têm sido utilizados para investigar o controle de operações estabelecedoras condicionadas transitivas(2) sobre o comportamento de organismos infra-humanos. Resultados referentes a estes procedimentos também serão apresentados. Esta maneira de tratar o tópico de motivação tem relevância para análise do comportamento porque promove o desenvolvimento de aspectos metodológicos e teóricos da ciência do comportamento.

 

ASPECTOS HISTÓRICOS DO TERMO OPERAÇÃO ESTABELECEDORA E A PROPOSTA DE MICHAEL

Motivação tem sido considerada como um fator determinante da ação humana, mas tratamentos tradicionais sobre o tópico (e.g., Mook, 1987) têm enfatizado o papel de processos internos. Na análise do comportamento, o papel de tais processos internos inferidos tem sido minimizado em favor de causas ambientais do comportamento. Skinner (1938,1953) trata motivação em termos de operações de privação/saciação e estimulação aversiva, enfatizando-as como variáveis ambientais controladoras do comportamento.

Keller e Schoenfeld (1950) chamam a atenção para a necessidade de se conceituar motivação, como outras variáveis controladoras do comportamento, além dos eventos ambientais que funcionam como reforçadores. Para tanto, Keller e Schoenfeld (1950) introduziram o termo operação estabeledora, estando este termo ainda relacionado com o conceito de impulso (drive), porém não como evento interno, mas como um termo utilizado para especificar o fato de se poderem executar certas operações sobre o organismo (e.g., privá-lo de alimento). Segundo eles, estas operações têm efeitos sobre o comportamento, que indicam uma mudança momentânea da efetividade de um evento como reforçador e da mudança da freqüência de qualquer comportamento que tem sido seguido por este evento reforçador. Na mesma linha de análise, Millenson (1967) identificou o conceito de impulso (drive) como um meio de enfatizar"... a habilidade de certas operações de estabelecer reforçadoresMillenson classifica dois tipos de operações de impulso (drive operations): "1 . uma que tem a função de reduzir ou eliminar o valor reforçador (saciação) e outra 2. que trabalha para aumentar o valor dos reforçadores (privação)" (Millenson, 1967, p. 366).

Neste sentido, Millenson define Motivação como Skinner (1938), ou seja, em termos de saciação/privação, embora Skinner não tenha utilizado o termo "operação estabelecedora".

Michael (1982,1993) desenvolveu o conceito de operação estabelecedora para incluir um tipo de variável motivacional aprendida que não foi explicitamente identificada pelos tratamentos anteriores (Skinner, 1938, 1953; Keller e Schoenfeld, 1950 e Millenson, 1967). Desta forma, ao retomar o conceito de operações estabelecedoras, a contribuição de Michael consiste em um novo instrumento conceituai e metodológico caracterizado como operações estabelecedoras condicionadas, especialmente as do tipo transitivas.

Michael (1983) define uma operação estabelecedora (EO) com uma variável ambiental que

1. momentaneamente, altera a efetividade reforçadora de algum objeto, evento ou estímulo, e

2. momentaneamente, altera a freqüência de um tipo de comportamento que tem sido reforçado por aquele objeto, evento ou estímulo. Ao primeiro efeito descrito denominou-se de "efeito estabelecedor do reforço" e, ao segundo, de "efeito evocativo".

As operações estabelecedoras foram classificadas, por Michael, em duas categorias:

1. operações estabelecedoras incondicionadas (UEOs) que são de origem filogenética e variam de espécie para espécie, e

2. operações estabelecedoras condicionadas (CEOs) que têm origem ontogenética e, portanto, relacionadas com a história de cada organismo.

A distinção entre estas duas operações é feita com base no efeito estabelecedor do reforço, pois este pode ser inato ou aprendido. O efeito evocativo é geralmente aprendido em ambos os tipos de EOs (UEOs e CEOs). Privação de alimento é um exemplo de UEO: alimento torna-se mais efetivo como forma de reforçamento para muitos mamíferos como resultado da privação de alimento, sem nenhuma história de aprendizagem, mas o repertório comportamental para adquirir alimento é aprendido por estes organismos.

As operações estabelecedoras condicionadas foram classificadas em três tipos:

1. operação estabelecedora condicionada substituta - trata-se da relação mais simples, que envolve uma correlação temporal de um evento neutro que sistematicamente antecede uma UEO ou uma CEO e, como resultado deste emparelhamento, aquele evento adquire a característica motivacional da UEO ou da CEO com a qual fora emparelhado;

2. operação estabelecedora condicionada reflexiva - envolve uma relação mais complexa em que um evento ou estímulo sistematicamente precede alguma forma de estimulação aversiva e, se for removido antes da ocorrência da estimulação aversiva, a estimulação aversiva deixará de ocorrer. São exemplos de CEO reflexiva os procedimentos de esquiva sinalizada. Neste caso, o evento ou estímulo sinalizador funciona como uma variável motivacional do tipo CEO reflexiva, e não como um estímulo discriminativo, como enfatiza a literatura sobre esquiva sinalizada (Michael, 1993). Este tipo de CEO foi assim denominada por Michael porque o estímulo sinalizador adquire a capacidade de estabelecer sua própria remoção como forma efetiva de reforçamento condicionado e evoca qualquer comportamento que tenha produzido a supressão deste estímulo reforçador condicionado;

3. operação estabelecedora condicionada transitiva - é a relação mais complexa e foi relacionada por Michael com o conceito de reforçamento condicionado condicional. A efetividade de muitas formas de reforçamento condicionado pode depender de uma condição de estímulo na qual estes reforçadores condicionados foram estabelecidos. A demonstração empírica deste tipo de CEO tem recebido atenção de alguns pesquisadores com trabalhos publicados (MCPherson e Osborne, 1986,1988) e de outros com trabalhos não publicados (Lubeck, R. C. e McPherson, A., 1986(3)); McPherson, Trapp e Osborne, 1984(4); Alling, 1990 e da Cunha, 1993). Estas demonstrações empíricas têm utilizado pombos como sujeitos experimentais e têm, de certa forma, demonstrado com algum sucesso o desenvolvimento de procedimentos experimentais para investigar a CEO transitiva como uma variável ambiental e motivacional controladora do comportamento, a partir dos seus dois efeitos: estabelecedor do reforço e evocativo. Nestes procedimentos, tem sido difícil separar a função motivacional (CEO) da função discriminativa do evento ambiental manipulado nos experimentos. Desta forma, o problema fundamental para esta linha de pesquisa é desenvolver um procedimento que permita demonstrar empiricamente a distinção entre o controle motivacional e o controle discriminativo de um objeto ou um evento sobre o comportamento. Surge, assim, uma nova área de investigação na análise experimental do comportamento, assim como uma possibilidade para que os analistas do comportamento estudem motivação como uma variável independente e não apenas como uma variável de contexto.

Procedimentos experimentais na demonstração de CEO

da Cunha (1993) descreveu os principais procedimentos até então utilizados nas investigações de operações estabelecedoras condicionadas transitivas. Entre eles temos:

1. Procedimento de três discos. McPherson e Osborne (1986,1988) utilizaram pombos como sujeitos experimentais em um procedimento de tentativas discretas utilizando três discos. Durante o intervalo entre tentativas (ITI) todos os discos permaneciam escuros. Cada tentativa começava com a iluminação do disco da direita. A primeira bicada neste disco iluminado provocava a iluminação do disco do centro e, depois desta conseqüência, bicadas no disco da direita não tinham mais efeito. A iluminação do disco da esquerda era controlada em função de um esquema de tempo variável (VT) ou tempo randômico (RT). Quando o disco da esquerda estava iluminado, uma bicada no disco de centro era seguida por alimento e, somente nesta condição, bicar o disco do centro não tinha mais efeito. Cada tentativa terminava depois doacesso ao alimento, e as tentativas eram separadas por um intervalo entre tentativas (ITI).

De acordo com a concepção teórica de Michael, o reforçamento para bicar o disco da direita é a iluminação do disco do centro (uma forma de reforçamento condicionado) porque alimento só poderia ser obtido com bicadas neste disco quando o disco da esquerda estivesse iluminado. Quando o disco da esquerda não estava iluminado, bicar no disco do centro não tinha valor. A iluminação do disco da esquerda, então, funcionava como uma CEO transitiva, estabelecendo a iluminação do disco do centro com uma forma efetiva de reforçador condicionado e evocava um comportamento (i.e., bicar o disco da direita). A iluminação do disco do centro é um reforçador condicionado cuja efetividade reforçadora é condicional à iluminação do disco da esquerda. Nestas condições, o desempenho que constituiria evidência para a interpretação acima, consistiria em esperar a iluminação do disco da esquerda, então, bicar o disco da direita, cuja conseqüência imediata era a iluminação do disco do centro e, finalmente, bicar o disco do centro que resultava em alimento.

Na primeira investigação (McPherson e Osborne, 1986), os sujeitos esperaram apropriadamente a iluminação do disco da esquerda antes de emitirem a resposta no disco da direita, sendo isto observado para a maioria das tentativas. Os dados foram plotados para 50 tentativas por sessão. O controle não foi evidente, ocorrendo depois de 60 ou mais sessões. Apenas um entre os quatro pombos demonstrou o desempenho previsto. No segundo estudo, alterou-se o tempo de iluminação dos discos do centro e da esquerda. Quando o disco da esquerda era iluminado - em média 12 seg. depois da iluminação do disco do centro -o controle pela CEO (iluminação do disco da esquerda) sobre o responder no disco da direita foi geralmente muito fraco.

Com o objetivo de demonstrar o efeito da CEO, os procedimentos de três discos tiveram duas fraquezas. As contingências nos três discos facilitavam uma interpretação de automodelagem de alguns aspectos do desempenho. Também, o fato de responder no disco da direita produzir a iluminação do disco do centro (reforço condicionado), condição esta que permanecia até a obtenção do alimento, reduzia o contato com tentativas sem uso do disco do centro quando o disco da esquerda estava escuro. Esta característica do procedimento também fez com que a suposta CEO funcionasse como um estímulo discriminativo para bicar o disco do centro quando o disco do centro estava iluminado antes da condição de CEO.

2. Procedimento de pedal-e-disco. Alling (1990) utilizou um procedimento para garantir topografias diferentes para produzir o reforço condicionado e o reforço primário. Os pombos deveriam pressionar um pedal localizado próximo ao assoalho da câmara experimental para produzir uma mudança de luz (de branca para vermelha) localizada acima do pedal, que permanecia acesa por 5 seg., tempo necessário para o pombo bicar o disco iluminado para receber alimento. A duração do reforço condicionado neste procedimento foi uma mudança importante em relação ao procedimento de três discos. A mudança da cor da luz do pedal funcionaria como reforçamento condicionado e o valor deste reforço dependeria de outra condição ambiental, ou seja, da luz da câmara experimental.

O ambiente experimental era constituído de dois pedais com suas respectivas luzes (acima dos pedais) localizados à direita e à esquerda em relação ao comedouro, mas apenas o pedal da direita foi operado; dois discos de resposta, sendo apenas o da esquerda iluminado com luz branca; luz da câmara experimental e um microfone. O comedouro era iluminado durante o período de disponibilidade do reforço.

O procedimento de Alling consistia da instalação de uma cadeia comportamental de duas resposta, em que a reposta de pressionar o pedal em CRF tinha como conseqüência a mudança da cor da luz, acima do pedal, de branca para vermelha, durante 5 seg. Uma única bicada no disco da esquerda na presença da luz vermelha (acima do pedal), produzia imediatamente, por 5 seg., apresentação de alimento, dependendo da condição de iluminação da câmara experimental. Para dois pombos, bicar o disco quando a luz do pedal estava vermelha foi seguida de alimento quando a luz da câmara experimental estava acesa. Para um pombo, bicar o disco quando a luz do pedal estava vermelha era seguida de alimento, quando a luz da câmara experimental estava apagada. Estas condições definiam a condição de CEO para cada grupo, e seu oposto, a condição de não CEO. Cada tentativa experimental começava com a condição de não-CEO; a condição de CEO foi gerada com base em esquema de tempo variado VT 60 seg. Quando a condição de CEO começava, permanecia em efeito até a obtenção de alimento.

Neste procedimento, o desempenho esperado seria não pressionar o pedal até que a condição de CEO (luz ou não-luz ambiente, dependia do grupo) estivesse presente; então, a reposta no pedal produzia a mudança de cor (de branca para vermelha) da luz acima do pedal; se em 5 seg. o pombo bicasse o disco da esquerda, esta resposta era seguida por 3 seg. de acesso ao alimento. Todos os três pombos desenvolveram o desempenho previsto (em 90% ou mais das tentativas verificou-se que a resposta no pedal ocorria na presença da condição de CEO), dois pombos exibiram o desempenho esperado em menos de 25 sessões e um pombo depois de 50 sessões. Numa segunda fase, removeu-se a conseqüência para a reposta no pedal (mudança de cor da luz do pedal, reforçador condicionado). Com este procedimento esperava-se que ocorresse a quebra da cadeia comportamental. Entretanto, esta ruptura na cadeia não foi observada. A luz da câmara experimental pode ter funcionado como um estímulo discriminativo e não como uma CEO para a resposta no pedal. Acredita-se, também, que esta cadeia de duas respostas tenha funcionado como uma única resposta, pois um esquema de FR:1 (CRF) controlava a resposta de pressionar o pedal e, provavelmente, o responder no disco estivesse mais sob o controle da luz da câmara experimental do que da luz produzida pelo responder no pedal. Outro aspecto que pode ter contribuído para este resultado foi o uso de dois estímulos visuais, pois a condição de iluminação (luz/escuro) poderia criar condições de estímulos diferentes quando a luz do pedal estivesse branca ou vermelha. Por exemplo, a luz vermelha acima do pedal poderia ser caracterizada como condição de estímulo diferente, se a câmara operante estivesse iluminada ou escura.

Na tentativa de continuar com as investigações sobre operações estabelecedoras condicionadas transitivas, da Cunha (1993) utilizou um esquema de razão variável (VR 6) para controlar a reposta de pressionar o pedal que prodúzia a mudança da luz do pedal (de branca para vermelha) por 5 seg. Substituiuse por um estímulo auditivo o evento que funcionava como a suposta CEO (um som tipo bip), cuja apresentação foi controlada por um tempo randômico de 1 minuto. Quatro pombos foram distribuídos em dois grupos em que a suposta CEO, para um grupo, era a presença do som e, para o outro, a sua ausência e seu oposto estabelecia a condição de não-CEO. A variável dependente definida nos procedimentos anteriores (McPherson e Osborne, 1986,1988 e Alling, 1990) foi o percentual de tentativas sem erro. Uma mudança de medida foi adotada neste procedimento, utilizando-se, nas duas condições, a taxa de respostas executadas no pedal (antes e depois da apresentação da suposta CEO). Também plotaram-se os dados com base em percentagem de tentativas sem erro, para compará-los como os dados obtidos nas pesquisas anteriores.

da Cunha (1993) verificou que a taxa de repostas é uma medida mais sensível do que a percentagem de tentativas sem erro ao longo da sessões. Observando-se o percentual de tentativas sem erros após 73 sessões, o critério de 80% de tentativas sem erro em três sessões consecutivas não foi verificado. Para todos os sujeitos, verificou-se nitidamente que a taxa de respostas de pressão ao pedal na condição de CEO foi maior do que a taxa de respostas de pressão ao pedal na condição de não-CEO e, a partir da décima segunda sessão, verificou-se um responder no pedal diferenciado quando a suposta CEO estava presente ou ausente. A taxa de respostas (R/ min) de pressão ao pedal na presença da suposta CEO variou de 24 a 27 R/mim, enquanto que a taxa de respostas de pressão ao pedal na ausência das suposta não-CEO) variou de 2 a 8 R/mim, considerando os dados dos quatro sujeitos durante a primeira fase. Esperava-se uma deterioração da cadeia comportamental durante a fase 2 (enquanto o evento reforçador condicionado era removido); este dado foi observado apenas para um dos quatro pombos. Os demais sujeitos, provavelmente, desenvolveram um padrão de pressionar o pedal várias vezes e, então, bicar o disco. Se reforço incondicionado, que seguia a resposta de bicar o disco, não fosse liberado, os pombos retornavam ao pedal que, eventualmente, permitia que a razão variada fosse completada. A fase 3 do procedimento consistia na retomada da fase 1. Algumas falhas neste procedimento também foram observadas; por exemplo, não havia uma contingência punitiva para as respostas de mudança do pedal para o disco e viceversa. Verificou-se que os dois sujeitos que mantiveram o responder no pedal depois da remoção do reforçador condicionado tiveram, acidentalmente, as respostas de mudança reforçadas Observou-se, também, que o decréscimo da taxa de respostas na condição de não-CEO poderia ter sido mascarado pelo fato de nesta condição ocorrer um procedimento de extinção. Deste modo, dever-se-ia plotar apenas a taxa de resposta para o primeiro bloco de razão na condição de não-CEO. Estas observações indicam os possíveis desenvolvimentos da pesquisa sobre a função discriminativa e motivadora das operações estabelecedoras condicionadas transitivas.

Um dos aspectos fundamentais da proposta de Michael é a possibilidade de que a análise do comportamento tem de investigar o controle de variáveis moticionais, como variáveis independentes , proporcionando, de certa forma, o resgate do tópico de motivação para uma abordagem analítica comportamental. Verifica-se que mesmo com a ressalva de Keller e Schoenfeld (1950) para a importância do conceito de motivação, este ficou, por muitos anos, colocado em segundo plano, talvez em favor, por exemplo, das investigações sobre esquemas de reforçamento. A proposta conceituai e metodológica de operações estabelecedoras, retomada por Michael, não apenas estabelece uma nova linha de pesquisa na análise experimental, como também prioriza a variável motivacional como evento ambiental tratado como uma variável independente, ou seja, enfatiza o estudo do controle desta variável sobre o comportamento.

Concluindo, acredito que o atual estágio de pesquisa sobre operações estabelecedoras caracteriza-se pela tentativa de se desenvolver empiricamente um procedimento que demonstre o papel controlador de uma operação estabelecedora condicionada transitiva, de modo a demonstrar como seus dois efeitos (estabelecedor do reforço e evocativo) atuam sobre o comportamento dos organismos. As pesquisas atuais indicam que a distinção entre as funções discriminativas e motivacionais (operações estabelecedoras) é um dos aspectos fundamentais que desafia o pesquisador na busca de um procedimento experimental, e é nesta fase que se encontram, ao meu ver, as em pesquisas sobre operações estabelecedoras.

 

Referências Bibliográficas

Alling K.L. (1990) The effects of a conditioned establishing operation on performance of two component chain. Dissertação de mestrado. Western Michigan University, Kalamazoo, MI.

da Cunha, R.N. (1993) An experimental demonstration of the transitive conditioned establishing operation with pigeons. Tese de doutoramento. Western Michigan University, Kalamazoo, MI.

Keller, F.S. e Schoenfeld, WN. (1950) Principles of Psychology. New York: Applenton-Century-Crofts.

McPherson, A. e Osborne, J.G. (1986) The emergence of establishing-stimulus control. Psychological Record, 36, 375-386

McPherson, A. e Osborne, J.G. (1988) Control of behavior by an establishing stimulus. Journal of the Experimental Analysis of Behavior, 49, 213-227.

Michael J. (1982) Distinguishing between discriminative and motivational functions of stimuli. Journal of the Experimental Analysis of Behavior, 37, 149-155.

Michael, J. (1993) Establishing operations. The Behavior Analist, 16,191-206.

Millenson, J.R. (1967) Principle of Behavior Analysis. New York: Macmillan.

Mook, D.G. (1987) Motivation. New York: W W. Norton and Company

Skinner, B.F. (1938) The Behavior of Organism. New York: Applenton-Century-Crofts.

Skinner, B.F. (1953) Science and Human Behavior. New York: Macmillan.

 

 

(1) Este trabalho constitui parte da tese de doutoramento apresentada pela autora ao Departamento de Psicologia da Western Michigan University, Kalamazoo, MI - USA, em julho de 1993. Agradeço a inestimável orientação recebida pelo Dr. Jack Michael, ao CNPQ - processo 200.66188.9 - pelo apoio financeiro, e à UNB, pelo apoio institucional
(2) Michael emprega o termo "transitiva" no sentido gramatical como um verbo transitivo que necessita de um objeto direto
(3) McPherson, A. Trapp, N. L. e Osborne, J. G. (1984, May). Regular and unpredictable onset of the establishing stimulus. Em, J. G. Osborne (Org.), The establishing stimulus: theory development ans ongoing research. Symposium conducted at the Tenth Annual Convention of the Association for Behavir Anlysis, Nashiville, TN
(4) Lubeck, R. C. e MacPherson, A.,. (1986). Establishing stimuli with pigeons: procedure, parameters, and point of view. Paper presen ted at the meeting of the Twelfth Convention of the Association for Behavior Analysis, Milwauukee, Wis