Construção terminológica e conceitual do controle aversivo: período Thorndike-Skinner e algumas divergências remanescentes

Gongora, Maura Alves Nunes; Mayer, Paulo César Morales; Mota, Carolina Martinez Sampaio

Servicios Personalizados

Revista

Articulo

Traducción automática

Indicadores

Accesos

Otros
Otros

Permalink

Temas em Psicologia

versión impresa ISSN 1413-389X

Temas psicol. vol.17 no.1 Ribeirão Preto 2009

ARTIGOS

Construção terminológica e conceitual do controle aversivo: período Thorndike-Skinner e algumas divergências remanescentes

Terminological and conceptual construction of the aversive control: Thorndike-Skinner period and some remaining divergences

Maura Alves Nunes Gongora^I; Paulo César Morales Mayer^II; Carolina Martinez Sampaio Mota^III,¹

^IUniversidade Estadual de Londrina - PR - Brasil
^IIUniversidade Estadual de Londrina - PR - Brasil
^IIIUniversidade Estadual de Londrina - PR - Brasil

Endereço para correspondência

RESUMO

Neste ensaio, procura-se apresentar alguns aspetos históricos relevantes da construção terminológica e conceitual do controle aversivo. Foram descritos alguns tópicos do período que vai de Thorndike (1911) a Skinner (1953). Desse período, foram demonstradas as primeiras tentativas de formular as leis comportamentais atualmente conhecidas: os princípios de reforço (positivo e negativo) e de punição (positiva e negativa). Foram também relatadas e discutidas, brevemente, algumas divergências terminológicas e conceituais atuais, na área do controle aversivo. As divergências referem-se a cinco temas: uso da expressão "reforçador negativo"; distinção entre contingências de reforço positivo e negativo; diferentes posições teóricas a respeito da punição; conceito popular e científico de punição e, exclusão do hedonismo. Os resultados permitem ilustrar importantes debates atuais na área do controle aversivo e demonstrar um pouco do esforço e do empenho que a construção de uma ciência demanda, seja na construção de uma linguagem técnica, seja na construção teórico-conceitual.

Palavras-chave: Controle aversivo, Construção terminológica, Construção conceitual, Thorndike, Skinner.

ABSTRACT

This essay is an attempt to present some important historical aspects on the terminological and conceptual construction of the aversive control. Some topics of the period from Thorndike (1911) to Skinner (1953) were described showing the first attempts to formulate the behavioral laws currently known: the reinforcement and punishment principles (both positive and negative). Some current conceptual and terminological divergences about the aversive control field were also briefly reported and discussed. These divergences refer to five themes: use of the expression "negative reinforcer"; distinction between the positive and the negative reinforcement contingencies; different theoretical approaches of punishment; popular and scientific concepts of punishment and, exclusion of hedonism. The results present important current debates in the aversive control field and show partially the efforts and dedication demanded for the development of a science, be it related to its technical language, or to its theoretical-conceptual construction.

Keywords: Aversive control, Terminological construction, Conceptual construction, Thorndike, Skinner.

O processo de construção da terminologia própria da Análise do Comportamento mostra as tentativas de descrever o comportamento em uma perspectiva científica: de forma clara, objetiva e, por vezes, utilizando-se de definições operacionais dos termos adotados, buscando a formulação de leis que descrevessem as relações indivíduo-ambiente. Muitas dessas tentativas almejaram dissolver as dissonâncias que os primeiros termos adotados nessa ciência propiciavam, dentre elas, algumas ambigüidades lógicas e o excesso de significados decorrentes do uso de termos derivados da linguagem popular. O "controle aversivo" constituiu parte importante da construção terminológica da Análise do Comportamento. Hoje, entende-se por controle aversivo, uma área cujos termos e conceitos dizem respeito aos princípios de reforço negativo (incluindo fuga e esquiva) e aos princípios de punição (incluindo punição negativa e positiva). Na construção terminológica dessa área, verifica-se que, apesar de todo o esforço demonstrado por seus teóricos, com suas formulações e reformulações, eles ainda não conseguiram romper de todo com certos resquícios da linguagem popular e nem com certas dissonâncias lógicas e conceituais.

Este ensaio tem dois objetivos. O principal deles é descrever e analisar alguns aspectos relevantes da construção terminológica e conceitual do controle aversivo, no período que vai de Thorndike (1911) a Skinner (1953/2003). Serão focadas as formulações desses dois autores, mas principalmente as de Skinner, devido à sua maior importância na consolidação das bases conceituais da Análise do Comportamento. Cabe ressaltar que, apesar de incluirmos nos objetivos algumas análises conceituais, elas serão tratadas apenas sucintamente e na medida em que auxiliem no esclarecimento do uso da terminologia, que constitui o foco principal deste ensaio. Um segundo objetivo é mostrar que alguns dos problemas que permearam a construção terminológica e conceitual, no período aqui examinado (até 1953), ainda continuam presentes em importantes debates atuais.

A formulação de princípios comportamentais: da Lei do Efeito à primeira versão skinneriana em 1938

Pode-se considerar que os aspectos mais relevantes da história da terminologia relativa ao controle aversivo são aqueles que aparecem junto com as tentativas de explicar o comportamento através das suas conseqüências. Embora o conceito de comportamento operante, que diz respeito aos comportamentos selecionados por suas conseqüências, seja atribuído a Skinner, Thorndike (1911) já mencionava a importância de se considerar as conseqüências na explicação do comportamento (Skinner, 1969/1980; Chance, 1999). A relevância dos primeiros estudos e formulações conduzidos por Thorndike tem sido reconhecida por diferentes autores, entre eles, Michael (1975), Catania (1998/1999), Chance (1999), e pelo próprio Skinner (1953/2003): "(...) uma das primeiras tentativas sérias de estudar as mudanças ocasionadas pelas consequências do comportamento foi feita por E. L. Thorndike em 1898." (p. 65).

Thorndike conceituava tais mudanças em termos de efeitos emocionais: a "satisfação" que exercia efeito fortalecedor e o "desconforto" que enfraquecia a conexão entre a situação e as respostas. Nas palavras do autor: "o termo conexões é utilizado para expressar essas tendências de uma dada situação evocar certas respostas ao invés de outras" (Thorndike, 1931, p. 4). Tais efeitos eram por ele explicados, inicialmente, por duas leis opostas, uma positiva, a da recompensa, relacionada à satisfação do organismo e ao fortalecimento de conexões entre situação e respostas; outra negativa, a da punição, relacionada ao desconforto e ao enfraquecimento de tais conexões. Ao conjunto dessas duas leis, Thorndike (1911) denominou "Lei do Efeito". Entretanto, mais tarde, em 1931, essa primeira lei foi reformulada e substituída por uma segunda Lei do Efeito, da qual ele excluiu o princípio da punição e manteve apenas o da recompensa. Isto tendo como base a constatação de que, em estudos de punição, com escolha de palavras, punir escolhas incorretas com a palavra "Errado" não afetava, significativamente, a freqüência de ocorrência dessas respostas.

Particularidades do uso corriqueiro do termo recompensa, entretanto, poderiam comprometer o significado científico pretendido com seu uso: "como a história da palavra demonstra, recompensa sugere compensação, algo que termina um sacrifício ou perda, devido a um gasto de esforço" (Skinner, 1986, p. 569). Como Skinner não queria dar essa conotação para o princípio comportamental que tentava formular, justificou, assim, sua preferência pelo termo "reforço": "A recompensa sugere uma compensação por comportar-se de uma maneira dada, freqüentemente em alguma espécie de acordo contratual. O reforço no seu significado etimológico indica simplesmente o fortalecimento de uma resposta" (Skinner, 1969/1980, p. 254). Por sua vez, o conceito de punição, utilizado na primeira Lei do Efeito, proposta por Thorndike (1911), aludia a efeitos desagradáveis ao organismo.

Origem popular do termo punição

Na linguagem popular e jurídica, "punição" significa, em termos gerais, aplicação planejada de castigo ou de penalidade, com finalidade corretiva ou meramente retributiva (Mulick, 1990; Greco, 2008). Nesse caso, os comportamentos considerados merecedores de punição são aqueles avessos a determinados pressupostos culturais e, como tais, considerados maus, condenáveis, errados, indesejáveis, subversivos, desfavoráveis, imorais, criminosos, ilegais ou pecaminosos. Desta forma, o termo punição apresenta-se fortemente associado a noções de justiça, como uma medida extrema de controle do comportamento de indivíduos, na busca do equilíbrio entre interesses individuais e coletivos. Entretanto, vale salientar que as medidas punitivas, segundo tal enfoque, são dirigidas ao indivíduo, seja como forma de retribuir os danos causados pelos seus atos, de reprimir tal comportamento ou de servir de exemplo para que outros indivíduos evitem comportar-se de forma semelhante (Greco, 2008). Com isso, o termo punição, vindo do vocabulário popular, carrega conotações de dor, sofrimento, vingança e desconforto (Skiba & Deno, 1991; Brown & Hendy, 2001). Além disso, segundo essa concepção, punição é uma medida dirigida a alguém que "fez por merecer", mas, aplicada por alguém com autoridade social reconhecida para tal (Mulick, 1990, p.144).

Ao ser utilizado por Thorndike para descrever mudanças comportamentais contrárias à recompensa, o termo punição agregou alguns dos sentidos populares, especialmente, o de ser um castigo ou penalidade, que deveria ser desagradável para o indivíduo a ela submetido. Isso contribuiu para a manutenção de uma concepção ética da punição, (Johnston, 1972; Michael, 1975; Mulick, 1990; Brown & Hendy, 2001).

Se punição produzia sentimentos desagradáveis e dolorosos, poderia ser eticamente condenável. Então, surgiram acirradas críticas contrárias, de modo generalizado, ao uso da punição. Nessas restrições, não se esclarecia se a condenação dirigia-se à punição enquanto um princípio que descreveria um processo comportamental natural, ou se a condenação dirigia-se apenas aos procedimentos planejados, utilizados em certas práticas culturais. Assim, graças à sua origem, o termo punição manteve-se associado a referências ético-morais que retratavam mais a produção de efeitos desconfortáveis do que, propriamente, as alterações comportamentais diretas que poderiam resultar dos procedimentos comportamentais denominados punitivos. Sobre isso, Skiba e Deno (1991) afirmam: "(...) quando um procedimento é assim denominado com um rótulo impreciso ou inapropriado, reações negativas ao procedimento podem ser baseadas tanto nas conotações do rótulo quanto em qualquer qualidade inerente ao procedimento" (p. 308).

As primeiras formulações de Skinner (1938)

Na opinião de Michael (1975) foi, entre outros motivos, na tentativa de resolver alguns dos problemas acima, que Skinner (1938) reformulou a Lei do Efeito de Thorndike, apresentando-a na forma de princípios comportamentais. Em seu livro Contingências de Reforço (1969/1980), Skinner trata em detalhes das contribuições de Thorndike à construção da Análise do Comportamento, mas apresenta também ali suas discordâncias, particularmente, em relação às unidades de medida que ele utilizava nos estudos de aprendizagem.

Os experimentos de Thorndike eram, em geral, conduzidos com gatos, que poderiam escapar de um compartimento puxando uma argola, pressionando um botão, ou de outras formas arranjadas pelo experimentador. Ao ser bem sucedido, o gato era recompensado com alimento. A principal unidade de medida utilizada era o tempo que o gato levava para conseguir escapar da caixa-problema; a diminuição do tempo gasto a cada nova tentativa era considerada, pelo autor, uma medida de aprendizagem (Skinner, 1969/1980). Entretanto, Skinner (1950/1982), entendia que essa medida era pouco fiel para descrever o que o organismo, de fato, estava fazendo. Ou seja, o organismo poderia comportar-se de diversas formas que poderiam influenciar no tempo que ele levaria para executar a resposta em questão e, em decorrência disso, diversos processos de aprendizagem poderiam estar envolvidos. Trata-se de uma medida que pode não variar continuamente ou ordenadamente, o que obscurece o papel das variáveis independentes testadas. Além disso, medidas de tempo não poderiam ser tomadas como indícios de estados subjetivos de satisfação ou de desconforto, tal como pressupunham as explicações de Thorndike.

Para escapar dos problemas acima, Skinner (1938), assim como Thorndike, selecionava uma classe de respostas para ser observada. Entretanto, Skinner adotou outro tipo de medida: a taxa de respostas. Ele registrava em um gráfico cumulativo o número de respostas que o organismo executava em um espaço de tempo, o que permitia verificar o efeito, na variável dependente, da variável independente testada. Estava demonstrado, desse modo, o que Skinner entendia por processo de aprendizagem. Tratava-se de um processo comportamental que poderia ser diretamente observado através da inclinação da curva de registro da resposta estudada. Cabe destacar aqui a inovação introduzida por Skinner (1938) ao utilizar a taxa de respostas como dado básico para inferir probabilidade, um recurso fundamental na construção de princípios comportamentais. Em contraste com a medida adotada por Thorndike (o tempo gasto para executar a tarefa), Skinner pontua que a "taxa de respostas era também mais útil como uma medida porque poder-se-ia dizer que ela mostra a probabilidade com que uma resposta poderia ser emitida em um dado momento" (Skinner, 1989, p. 124). A taxa de respostas, além de constituir uma variável dependente de fácil acesso, é sensível a diferentes intervenções, o que permitia estudar o comportamento do organismo como um todo, sem necessidade de se apelar para variáveis subjetivas, particularmente aos estados internos do organismo (Skinner, 1969/1980). Essa inovação possibilitou a Skinner superar algumas das limitações então encontradas nos estudos e nas conclusões de Thorndike (1911,1931).

O processo de construção dos princípios comportamentais exigiu, além de importantes mudanças conceituais, um refinamento na linguagem utilizada e a introdução de uma nova terminologia. Na primeira tentativa de refinar a linguagem comportamental, em 1938, Skinner rompeu com a linguagem popular anteriormente adotada por Thorndike (1911). Ao descrever os princípios comportamentais, ele substituiu as denominações de Thorndike "recompensa e punição" por "reforço positivo e reforço negativo", respectivamente. Note-se, no entanto, que, nesta primeira versão skinneriana, o que foi denominado "reforço negativo" é o mesmo que atualmente é conhecido pela denominação "punição positiva" [uma vez que o termo punição foi, posteriormente, restabelecido por Skinner, em 1953].

Na primeira versão, de 1938, havia, também uma concepção diferente do que hoje se conhece, na Análise do Comportamento, por estímulos reforçadores positivos e negativos. Em Skinner (1938, p. 66), verifica-se que os estímulos "reforçadores positivos" se referiam àqueles eventos que seguiam os comportamentos ² e "aumentavam a probabilidade" destes ocorrerem novamente. Contrariamente, os estímulos "reforçadores negativos" descreviam aqueles eventos que "diminuíam a probabilidade" de ocorrência do comportamento que seguiam.

Consideremos agora alguns comentários de Michael (1975) a respeito do que representaram essas alterações de 1938 na construção terminológica e conceitual do controle aversivo. Em primeiro lugar, estímulos reforçadores, tanto os positivos quanto os negativos, são definidos por Skinner (1938) como eventos que seguem o comportamento. Ou seja, na manipulação de contingências, são apresentados após a ocorrência das classes de resposta que se deseja alterar. Além disso, conforme já exposto, o dado relevante para a análise dos processos de aprendizagem passou a ser a freqüência relativa (taxa) de respostas e não medidas indiretas (as medidas de tempo), como era o caso nos estudos de Thorndike. As novas medidas possibilitavam a identificação mais precisa das variáveis independentes, responsáveis pela mudança no comportamento. Isso era fundamental, segundo Skinner (1989), para a proposta central do behaviorismo de não apenas prever, mas também de controlar o comportamento.

Uma vez que na proposta skinneriana de 1938 o "reforço negativo" foi introduzido como um sinônimo (e substituto) para o termo "punição", anteriormente utilizado por Thorndike na sua primeira Lei do Efeito, ambos os termos (punição antes e reforço negativo nesta versão) implicavam redução na probabilidade do comportamento. A única diferença entre eles é que na punição, descrita na Lei do Efeito, tal redução era explicada por um suposto enfraquecimento das conexões entre situações e respostas que, por sua vez, era atribuído às sensações desconfortáveis ou dolorosas produzidas pelo estímulo punidor. Skinner (1938), por sua vez, não fez alusão a efeitos desagradáveis ou dolorosos; os estímulos reforçadores negativos e os positivos não foram ali definidos por critérios hedônicos (reforçadores positivos evocam sensações prazerosas e reforçadores negativos, sensações dolorosas). Também não foram definidos por juízo de valor - reforçadores positivos como eventos bons e os negativos, como maus (Michael, 1975).

Verifica-se assim, nas definições skinnerianas, um afastamento de critérios de valor. Ou seja, se nem os estímulos reforçadores e nem os procedimentos ou os princípios comportamentais são bons ou ruins por si mesmos, então os procedimentos comportamentais planejados para fazer uso de reforçadores negativos não poderiam ser, por definição, desaconselháveis. Michael (1975), ao referir-se aos princípios comportamentais atuais, também pontua que, do mesmo modo, os denominados procedimentos positivos (assim denominados porque se fundam nos princípios de reforço positivo), também não podem ser mais aconselháveis que os negativos, apenas por critérios intrínsecos à definição dos reforçadores ou dos princípios comportamentais adotados.

Do exposto até aqui, pode-se considerar que o conceito skinneriano de estímulos reforçadores (positivo e negativo) que permitia descrever leis ou princípios de reforço, apresentado em 1938 proporcionou um avanço no arsenal conceitual da Análise Experimental do Comportamento. Essa versão skinneriana não apelava para explicações hedonistas e atendia aos critérios do descritivismo científico (Skinner, 1950/1982; Chiesa, 1994). Entretanto, como veremos mais adiante, Abib (2007) argumenta que Skinner ainda não afastou completamente a possibilidade de uma explicação hedonista do reforço.

Redefinição de reforço negativo e recuperação do termo punição: as posições de Skinner em 1953

Apesar das reformulações apresentadas por Skinner em 1938, ainda restavam alguns questionamentos. Antes, porém, de apresentá-los e discuti-los, cabe aqui um esclarecimento a respeito da terminologia do reforço. Empregamos, em todo este artigo, o termo reforçador em referência ao estímulo e os termos reforçar, reforço ou reforçamento, tanto na acepção de operação (procedimento) quanto na de processo. Como uma operação, o termo reforço (ou reforçamento) refere-se à apresentação ou à remoção de um reforçador quando uma resposta ocorre. Assim, a operação é efetuada sobre a resposta. Como um processo, o termo reforço (ou reforçamento) refere-se ao aumento na freqüência do responder que se segue à operação de reforço (Catania, 1998/1999). Essa terminologia tem sido motivo de controvérsias; nossa opção pelo sentido sugerido por Catania se deve ao seu amplo uso entre analistas do comportamento.

Retornando à discussão das reformulações skinnerianas de 1938, verificava-se que enquanto não havia problemas com o reforço positivo, o reforço negativo apresentava-se problemático, ao menos em dois pontos: a) na ambivalência dos termos reunidos nas expressões "reforço negativo" e "reforçador negativo" e b) quanto aos efeitos enfraquecedores então descritos.

Analisando o primeiro problema, Michel (1975) pontua que havia uma imprecisão lógica entre os termos reunidos na expressão "reforço negativo", uma vez que o sentido original de cada um dos dois termos mostrava-se, aparentemente, incompatíveis. Ou seja, o termo "reforço" referia-se a mudanças comportamentais "assimétricas", pois se referia tanto ao fortalecimento (no reforço positivo), quanto à redução da probabilidade de comportamentos (no reforço negativo). Ao apresentar sua segunda versão para a definição de estímulos reforçadores, Skinner (1953/2003) dissolve a assimetria relativa ao termo "reforço", que passou a ser um termo genérico para designar apenas o processo de "fortalecimento" do comportamento, ou seja, deixou de referir-se a qualquer processo de "enfraquecimento" (Michael, 1975).

Nessa obra, Skinner apresenta uma outra concepção do que deve ser entendido por estímulos "reforçadores", sejam os positivos ou os negativos. Ele passa a distinguir dois tipos de estímulos reforçadores: o primeiro deles, o estímulo reforçador positivo, segue o comportamento, ou seja, é apresentado após a emissão da resposta ou é produzido por ela. Já o estímulo reforçador negativo consiste em eventos que devem estar presentes antes da ocorrência do comportamento, já que este é fortalecido, justamente, por remover tais eventos. Nesta segunda versão, portanto, os adjetivos negativo e positivo não se referem mais aos efeitos comportamentais de fortalecimento ou de enfraquecimento; independentemente de ser positivo, ou negativo, o termo reforço, na segunda versão skinneriana, designa processo de "fortalecimento" do comportamento. Isto implica outro sentido para os adjetivos positivo e negativo: agora o processo de reforço é considerado positivo por resultar da "apresentação" de eventos ou é considerado negativo, por resultar da "remoção" de eventos. O mesmo ocorre com o uso desses adjetivos para os estímulos reforçadores.

Os eventos que se verificam reforçadores são de dois tipos. Alguns reforços consistem na apresentação de estímulos, no acréscimo de alguma coisa - por exemplo, alimento, água, ou contato sexual - à situação. Estes são denominados reforços positivos. Outros consistem na remoção de alguma coisa - por exemplo, de muito barulho, ou de um choque elétrico - da situação. Estes são denominados reforços negativos. Em ambos os casos, o efeito do reforço é o mesmo: a probabilidade de resposta será aumentada (Skinner, 1953/2003 p. 81).

Pode-se verificar então que, nesta segunda versão, a assimetria em torno do termo "reforço", que antes apresentava dois sentidos distintos, entre o reforço positivo e o negativo, foi resolvida com a unificação de ambos em torno de um único processo: o efeito fortalecedor do reforço sobre o comportamento. Dito de outro modo: são "dois procedimentos" de reforço distintos (apresentação e remoção de estímulos), mas "um único processo" de reforço resultante, o aumento na probabilidade das respostas conseqüenciadas, de uma ou de outra forma, com os estímulos reforçadores. Vale ressaltar aqui, a título de reconhecimento histórico, a importância da publicação de Keller e Schoenfeld (1950/1974) no que se refere à discussão e redefinição do termo "reforço negativo", acima descrita. A contribuição decisiva de Keller e Schoenfeld foi destacada pelo próprio Skinner (1983), ao discorrer sobre a evolução conceitual do behaviorismo.

Resolvido esse primeiro problema em torno do termo reforço, continuava pendente o segundo problema: a descrição do "enfraquecimento" do comportamento.

Esse segundo problema também foi resolvido em Ciência e Comportamento Humano (1953/2003). A solução se deu, no entanto, com a "recuperação do termo punição". Embora Skinner (1953/2003) comumente se refira "à punição" no singular, ele afirma tratar-se de dois procedimentos popularmente utilizados para reduzir ou enfraquecer comportamentos: "Resolvendo o problema da punição simplesmente inquirimos: Qual é o efeito da retirada de um reforçador positivo ou da apresentação de um negativo?" (p. 202). Pode-se verificar, então, que Skinner (1953/2003) define punição como uma técnica de controle comportamental, popularmente utilizada para eliminar comportamentos, por meio de dois procedimentos distintos.

Na opinião de McConnell (1990), essa concepção de punição, envolvendo dois procedimentos, tornou difícil a compreensão desse tema. Um problema que, segundo esse autor, foi minimizado por Catania (1968), que passou a distinguir, com dois adjetivos, cada um dos dois procedimentos de punição, descritos em 1953, por Skinner. Assim, tal como já se distinguia, com dois adjetivos, os dois tipos de reforços (o positivo e o negativo), Catania passou a usar também tais adjetivos para distinguir os dois tipos de punição. Com isso, a "punição positiva" foi assim qualificada por definir-se pela introdução de estímulos (estímulos punidores, na terminologia de Catania) contingentes à emissão da resposta; enquanto a "punição negativa" recebeu esse adjetivo por ser definida como o procedimento de conseqüenciar a emissão da resposta com a remoção de estímulos disponíveis (neste caso, reforçadores positivos).

Ao reintroduzir o termo punição, no entanto, Skinner (1953/2003) parecia pouco favorável a considerar que tal termo se referisse a um procedimento cujo efeito fosse meramente oposto ao do reforço:

tudo isso é feito com a intenção de reduzir tendências de se comportar de certa maneira. O reforço estabelece essas tendências; a punição destina-se a acabar com elas (...) mais recentemente, levantou-se também a suspeita de que a punição não faz, de fato, aquilo que se supõe que faça (p.199).

Essa citação refere-se a uma tese veementemente defendida por Skinner ao longo de toda a sua obra: ele defende que a punição não é efetiva nem na supressão, nem na redução da probabilidade de ocorrência das respostas punidas, uma vez que seus efeitos enfraquecedores tendem a ser temporários.

Muitas das dúvidas de Skinner quanto à efetividade da punição e, também, quanto ao processo comportamental envolvido na supressão de respostas são derivadas de seu estudo clássico, publicado em 1938. Nele, ratos privados de alimento foram submetidos ao treino de pressão à barra, tendo alimento como conseqüência reforçadora, em um esquema de intervalo fixo. Em uma sessão posterior, a contingência entre a pressão à barra e o alimento foi eliminada e durante os 10 primeiros minutos cada pressão à barra, além de não produzir alimento, produzia um movimento reverso da barra que gerava um "tapa" nas patas do rato. Observou-se uma diminuição abrupta na taxa de respostas, durante o período de punição (tapa). Entretanto, constatou-se também que, cessada a punição, a taxa de respostas foi maior do que antes da punição e o número total de respostas de pressão à barra, ao final de um segundo dia de extinção, era o mesmo para ratos que haviam sido punidos e para os que haviam sido submetidos apenas à extinção.

Com os resultados acima, Skinner (1938) conclui que, dada a sua transitoriedade, os efeitos supressores da punição deviam-se a algum efeito emocional, produzido pela estimulação aversiva. Ou seja, passou a tratar a punição como problemática por dois motivos: seus efeitos diretos sobre a probabilidade do responder eram temporários e a exposição à estimulação aversiva produzia efeitos indiretos, emocionais, denominados por ele, em 1953, como "lamentáveis subprodutos" da punição. Assim, apesar de recuperar o termo punição, Skinner deu a ele um tratamento cauteloso e investigativo: "Se a punição não é o oposto da recompensa, se não funciona subtraindo respostas onde o reforço as adicionou, o que é que faz?" (p. 201).

Resumindo, nessa segunda versão, em 1953, verifica-se que, além do termo "reforço negativo" deixar de descrever a mesma contingência hoje conhecida por "punição positiva" (como ocorria na primeira versão em 1938), nesta versão, o reforço negativo passou a constituir o contrário da punição (da positiva). Ambos são contrários tanto no procedimento, quanto no processo de mudança comportamental. Isto é, enquanto o procedimento de punição positiva define-se pela apresentação de reforçadores negativos, cujo efeito desejado (o processo) seria a diminuição na probabilidade do comportamento; o procedimento de reforço negativo define-se pela remoção (ou cessação) de reforçadores negativos, cujo efeito esperado (o processo) é o aumento na probabilidade do comportamento.

A terminologia e as concepções do controle aversivo, seja do reforço negativo, seja da punição, atualmente utilizadas por analistas do comportamento, em geral, têm seu fundamento nessa segunda versão skinneriana de 1953. Os exemplos desse uso podem ser inúmeros, mas só para ilustrar podem ser citados Sidman (1989/2003), Baum (1994/2006), Catania (1998/1999) e Weber (2005).

Um esboço da terminologia hoje utilizada, exemplificada pelos autores acima, para descrever as contingências operantes, pode ser representado por quatro conjunções possíveis entre respostas e conseqüências, com os efeitos esperados de aumentar ou de diminuir a probabilidade de ocorrência do comportamento: a) "Apresentação" de reforçadores positivos imediatamente após a emissão de uma resposta - resulta em aumento na probabilidade (reforço positivo); b) "Remoção" de reforçadores negativos após a emissão de uma resposta - resulta em aumento na probabilidade (reforço negativo); c) "Apresentação" de reforçadores negativos imediatamente após a emissão de uma resposta - resulta em redução [ainda que discutível se temporária] na probabilidade (punição positiva); d) "Retirada" de reforçadores positivos disponíveis, imediatamente após o responder (a emissão de determinado comportamento torna algum reforçador indisponível) - resulta em redução na probabilidade (punição negativa).

As quatro conjunções acima descritas encontram-se representadas no Quadro 1, em seqüência cronológica, do período entre Thorndike (1911) e Skinner (1953/2003).

Com o Quadro 1, esperamos ter demonstrado alguns tópicos importantes relativos ao processo de construção da terminologia que trata dos conceitos que constituem, atualmente, a área do controle aversivo. Cabe ressaltar que as relações descritas nesse quadro mostram bem os critérios funcionais com os quais Skinner descrevia as contingências operantes. Por isso, os reforçadores negativos ali apresentados não foram assim denominados por serem desagradáveis ou dolorosos, mas por aumentarem a probabilidade de ocorrência do comportamento que os removem. Apesar do empenho de Thorndike e de Skinner na construção terminológica e conceitual da Análise do Comportamento e, em particular da área do controle aversivo, muitas questões terminológicas e conceituais dessa área ainda persistem. Sobre isso, Dinsmoor (2004) enfatiza que a construção de uma ciência e de seu arcabouço conceitual é trabalho árduo e constante.

Algumas questões terminológicas e conceituais remanescentes

Os termos utilizados e os conceitos adotados, na constituição da área do controle aversivo, têm se mostrado úteis, tanto para a pesquisa básica, quanto para as intervenções no campo da análise comportamental aplicada. Entretanto, apesar da sua utilidade, alguns dos termos e dos conceitos continuam apresentando certas ambigüidades e motivos para polêmicas. Seguem algumas dificuldades ou controvérsias remanescentes.

Manutenção da expressão reforçador negativo

Um primeiro problema terminológico tem sido a manutenção, por Skinner (1953/2003), da expressão reforçador negativo para referir-se aos eventos (estímulos) manipulados nas operações de reforço negativo e de punição. Cabe ressaltar que essa terminologia foi mantida pelo autor em publicação bem posterior, ou seja, Skinner (1989) afirma: "Se nós definirmos um reforçador negativo como aquele que fortalece o comportamento quando removido, então punição consiste em apresentar um reforçador negativo (...) ou remover um positivo" (p. 127). O uso dessa expressão é corrente entre analistas do comportamento, mas temos observado que ainda acarreta dois problemas. Um deles, com o primeiro termo, reforçador. Neste caso, a dificuldade está em incluí-lo na descrição de contingências que não são de reforço e como tal não implicam o fortalecimento do comportamento. É isto que ocorre com a definição de punição pela apresentação de um estímulo 'reforçador ' negativo após a emissão de uma resposta.

Ainda que Skinner (1953/2003) defina claramente o que é um estímulo reforçador negativo, manter o termo reforçador, neste caso, implica manter a ambigüidade já assinalada por Michael (1975). Em outras palavras, isso nos parece a manutenção da assimetria anteriormente citada, pois, se na definição operacional do princípio de reforço negativo deve prevalecer a segunda versão (de 1953) porque reforço passou a denominar apenas o fortalecimento do comportamento, então por que manter o termo 'reforçador ' negativo para denominar um estímulo cuja função, na punição positiva, seria a de produzir o enfraquecimento do comportamento?

O segundo problema com a expressão reforçador negativo diz respeito ao termo negativo. Tanto em Thorndike (1911,1931), quanto na linguagem popular, um sentimento negativo é entendido como um sentimento ruim, aversivo, doloroso e que deve ser evitado. Portanto, manter o qualificativo negativo para certos estímulos reforçadores, à revelia das definições operacionais, continua sendo compreendido como um estímulo com propriedades aversivas, que induz sentimentos ou sensações desagradáveis. Em resumo, o ponto a destacar nesta seção é que há uma dupla ambigüidade na expressão reforçador negativo. Alunos de graduação e mesmo de pós-graduação freqüentemente reclamam da dificuldade em compreender os conceitos e princípios do controle aversivo; entre outras coisas, eles se queixam dessas ambigüidades.

Sobre a distinção entre contingências de reforço positivo e de reforço negativo

Um segundo problema atual diz respeito a uma discussão já iniciada por Michael (1975) e retomada nos últimos anos. Trata-se da dificuldade para, em certos casos, distinguir contingências de reforço positivo das contingências de reforço negativo. Conforme apresentado anteriormente, o aspecto central da distinção entre uma contingência de reforço positivo e a de reforço negativo é a apresentação ou remoção de um determinado estímulo contingente à emissão de uma resposta. Sendo o reforço positivo a apresentação de um estímulo que não estava na situação e o reforço negativo a remoção de uma estimulação presente. O resultado, em ambos os casos, é o aumento na probabilidade da resposta em questão.

Em um texto clássico, Michael (1975) argumentou que, na prática, as distinções entre os dois tipos de contingências (de reforço positivo e de reforço negativo) não são tão claras assim. Por exemplo: um organismo privado de alimento poderia se comportar de modo a produzir comida em função do valor reforçador do próprio alimento (reforçamento positivo) ou em função da eliminação da fome (alívio da estimulação proprioceptiva das contrações estomacais). Ou seja, em certas contingências, possivelmente haveria dificuldades tanto para identificar, quanto para explicar se o que ocorreu foi um processo de reforçamento positivo ou negativo. Poderia haver uma interação dos dois processos. A questão seria, portanto, distinguir qual das duas contingências deveria ser considerada determinante da mudança comportamental observada. Com essa argumentação, ele sugeriu que se abandonasse a terminologia que distingue os processos de reforçamento positivo e negativo, permanecendo apenas a denominação "reforço".

Apesar das críticas de Michael (1975), a distinção terminológica de reforço positivo e negativo se manteve entre analistas do comportamento. Entretanto, Baron e Galizio (2005), sob a luz dos desenvolvimentos que a Análise do Comportamento apresentou nos 30 anos decorridos desde os questionamentos de Michael (1975), retomaram a sua tese de que, embora amplamente utilizada, a distinção entre reforço positivo e negativo não é clara e que, portanto, deveria ser abandonada. A publicação de Baron e Galizio (2005) reacendeu essa discussão e, no ano seguinte, vários autores posicionaram-se sobre o assunto, entre eles, Chase (2006), Iwata (2006), Michael (2006) e Sidman (2006).

Dois desses autores (Iwata e Chase) posicionaram-se parcialmente a favor de Baron e Galizio. Iwata (2006) concorda com o argumento de que há contingências nas quais é difícil determinar se é o reforço positivo ou o negativo que exerce o controle. Entretanto, ele apresenta-se menos radical quanto à posição de abandonar a distinção, pois, a considera útil para a descrição de procedimentos. Seu argumento é de que o uso da terminologia "positivo" e "negativo" deve ser determinado a partir da atividade do experimentador. Ou seja, se o experimentador programar a apresentação de um estímulo contingente a uma resposta, então o procedimento deveria ser qualificado com o adjetivo positivo (i.e. reforço positivo ou punição positiva), mas se ele programar a remoção de um estímulo, então o procedimento deveria ser qualificado com o adjetivo negativo (i.e. reforço negativo ou punição negativa). Chance (2006), de um modo similar ao de Iwata, argumenta que a distinção nem sempre explicita qual relação comportamental realmente ocorreu, mas defende que a manutenção da distinção é válida para se deixar mais evidente as diferentes formas com as quais os analistas do comportamento trabalham (ora apresentando a estimulação, ora retirando-a com o mesmo objetivo). Isso, diz ele, facilitaria o ensino da Análise do Comportamento, uma vez que facilitaria a demonstração, para os alunos, de diferentes procedimentos com os quais se podem produzir as mudanças comportamentais esperadas. Michael (2006), por sua vez, ao comentar o artigo de Baron e Galizio, concordou com os novos argumentos deles e reiterou seu posicionamento de 1975, incluindo novos exemplos e se mantendo firme na defesa da posição de que se deve abandonar a distinção. No entanto, é importante pontuar que os autores acima, que concordam com a maioria dos argumentos de Michael, inclusive Baron e Galizio, admitem que é difícil aos analistas do comportamento, por diversos motivos, virem a abandonar a distinção aqui debatida.

Outro posicionamento relevante foi o de Sidman (2006). Ele argumenta, entre outras coisas, que Baron e Galizio (2005) aceitaram muito facilmente a impossibilidade de se determinar quando se trata de apresentação ou de remoção de um reforçador em cada caso. Pontua, ainda, que eles utilizaram exemplos extremos e muito particulares, os quais não correspondem às situações comumente enfrentadas. E mais, afirma que se fôssemos abandonar todos os termos científicos que não se adequassem aos casos muito particulares, teríamos que revisar toda a terminologia comportamental hoje utilizada. No entanto, o argumento mais contundente de Sidman é o de que o reforço negativo (tanto quanto a punição) apresenta efeitos indiretos (emocionais) indesejáveis não encontrados no reforço positivo, o que seria, por si só, uma justificativa suficiente para se manter a distinção. Ou seja, Sidman (1989/2003, 2006) entende que a distinção entre as duas contingências auxilia na argumentação para a recomendação de procedimentos de intervenção fundados em reforço positivo, em substituição aos procedimentos fundados no controle aversivo.

Diferentes posições teóricas a respeito da punição

Um outro problema configura-se pelas controvérsias relativas a duas posições teóricas distintas, atuais, a respeito do modo como a punição opera. Cabe esclarecer que a punição aqui referida é a denominada punição positiva. Uma das posições concebe a punição, basicamente, como um "procedimento"; a outra posição vê punição como um "processo". A distinção e as controvérsias entre as duas posições são complexas e serão apenas esboçadas aqui, conforme nossos propósitos para esta seção. Maiores detalhes sobre este tema podem ser encontrados em Mayer (2009). A primeira posição vem sendo defendida por Skinner desde 1938. Ele considera que os efeitos da punição, mais do que simplesmente opostos aos do reforço, são mais complexos e envolvem uma interação de processos operantes e respondentes que precisam ser compreendidos. Com isso, ele defende uma assimetria entre os processos que operam no reforço e os que operam na punição. Enquanto reforço é definido por critério funcional, ou seja, pelo aumento na probabilidade de respostas, punição é definida por critérios procedimentais, ou seja, pela apresentação de um reforçador negativo ou pela retirada de reforçadores positivos, cujo efeito enfraquecedor (que seria o critério funcional) é discutível.

As dúvidas de Skinner quanto à efetividade da punição e ao processo comportamental envolvido na supressão de respostas é derivada, em grande parte, de seu estudo clássico de 1938, já descrito em seção anterior. Suas teses a respeito da punição praticamente não se alteraram ao longo do tempo. Como exemplo, segue uma citação, publicada 50 anos após a publicação de seu experimento clássico:

Os efeitos da punição, entretanto, aparecem razoavelmente bem explicados naquele livro (referindo-se a Skinner, 1938). Quando uma resposta é seguida por, digamos, um choque, uma reação emocional ao choque é condicionada de acordo com o condicionamento do Tipo S (pavloviano). Aproximar-se da alavanca elicia tal reação, a qual reduz a força do pressionar a barra. Eu poderia ter adicionado que comportamento incompatível poderia também ser fortalecido por qualquer redução em tal estímulo aversivo condicionado e poderia opor-se à ocorrência do comportamento punido. (Skinner, 1989, p. 127)

Essa complementação da teoria, de que uma resposta incompatível poderia ser fortalecida ao reduzir a estimulação aversiva condicionada, entretanto, foi proposta em 1953: "A punição, como vimos, não cria uma probabilidade negativa de que uma resposta seja executada, mas a probabilidade positiva de que um comportamento incompatível ocorra" (Skinner, 1953/2003, p.242).

Ao que parece, nessa citação, punição é entendida por Skinner como um processo comportamental secundário, no que diz respeito ao enfraquecimento do comportamento, ou seja, quando uma resposta é suprimida, não há uma relação direta entre a contingência e a supressão, mas sim a produção indireta de respostas emocionais e de operantes incompatíveis com a resposta punida. Em vista disso, os efeitos mais considerados por ele foram os indiretos, explicados pela interação entre reforçamento negativo (fortalecimento de respostas incompatíveis com a resposta punida) e condicionamento respondente (pela eliciação de respostas emocionais).

A concepção skinnerianna de punição tem gerado muitas discussões, particularmente após a década de 1960 com a publicação de Azrin e Holz (1966/1975). Nela, os autores propõem que a punição (assim como o reforço) seja definida por critérios funcionais ou, em outras palavras, seja definida a partir dos seus efeitos comportamentais: a redução na probabilidade de respostas. Isso implica o restabelecimento da simetria entre reforço e punição: considerar, como principal critério de definição, que ambos afetam a probabilidade de ocorrência da resposta, porém, em direções opostas. Azrin e Holz argumentam que outros experimentos, diferentes dos analisados por Skinner (1953/2003), permitem concluir que os efeitos da punição se devem a efeitos supressores diretos do estímulo punidor utilizado. Isto permite caracterizar a punição como um processo comportamental legítimo e primário, que pode ser funcionalmente explicado, sem a necessidade de se supor o fortalecimento de outras respostas competitivas como propunha Skinner.

As reformulações propostas por Azrin e Holz (1966/1975), acima apresentadas, foram feitas com base em diversos estudos dos próprios autores e em revisões de outras pesquisas sobre punição que utilizavam diversas inovações tanto metodológicas quanto em tecnologias de laboratório, ocorridas após Skinner (1938). Essas inovações permitiram identificar e demonstrar como algumas variáveis relevantes podiam fazer com que a punição pudesse apresentar efeitos tão duradouros quanto os do reforço. Entre tais variáveis, encontram-se a intensidade do estímulo punidor, a proximidade temporal entre a resposta e o estímulo, a possibilidade de emissão de respostas alternativas, dentre outras.

Quanto à aceitação de uma ou de outra posição, enquanto Michael (1975) e Lerman e Vorndran (2002) mostram indícios de que a posição de Azrin e Holz seria a mais aceita hoje, entre os analistas do comportamento, Spradlin (2002) afirma que tanto a posição de Skinner, quanto a de Azrin e Holz continuam, igualmente, em voga. O volume 75 de 2001 do JEAB (Journal of the Experimental Analysis of Behavior) teve uma sessão dedicada ao debate das duas posições com a participação de James A. Dinsmoor, Jack Michael, Philip Hineline, Alan Baron, Michael Perone e Wiliam M. Baum. Esses nomes, por si só, demonstram a importância atual desse tema, um tema que continua em debate já que não houve, entre eles, uma tendência nítida a favor de uma das duas posições.

Manutenção das conotações negativas, populares, de punição

Mais um problema remanescente refere-se à confusão entre o sentido popular e jurídico do termo punição, em contraposição às concepções comportamentais que sustentam o uso eventual de procedimentos punitivos, particularmente alguns usos com finalidade clínica. Skiba e Deno (1991) argumentam que, sendo a punição um termo utilizado por uma comunidade verbal mais ampla (a sociedade) com significados mais abrangentes e pouco precisos, dificilmente seria um termo útil para descrever as práticas dos analistas do comportamento. Devido ao sentido popular, já mencionado anteriormente, é praticamente inevitável que as pessoas reajam emocionalmente a tais intervenções, tendo em conta as conotações negativas que o termo já carrega.

Cabe ressaltar que as restrições à punição são próprias da atual concepção social e jurídica de "estado de direito" que defende os direitos de todo cidadão contra punições arbitrárias, outorgando a um agente social específico a função de punir conforme critérios e rituais previstos em lei (Cunha, Lorenzato, Ferraz, & Pinto, 2007; Greco, 2008). Parece ser por conta disso que o mesmo cidadão que é a favor da punição no domínio jurídico, não se importando com as dores que ela possa produzir, tende a ser contra seu uso no contexto da Psicologia. Isso deve ocorrer porque entendem que, nesse contexto, os indivíduos deveriam receber outros tipos de tratamento e não deveriam ser submetidos a procedimentos dolorosos, semelhantes aos dirigidos aos criminosos. Para o leigo, parece haver uma incompatibilidade lógica na associação dos termos punição e tratamento (Brown & Hendy, 2001).

Nessa mesma direção, Mulick (1990) afirma que, muitas vezes, discussões e argumentações feitas por populares, com base em sua concepção leiga de punição, misturam-se às argumentações com base em concepções científicas, e com argumentações específicas para o uso clínico, pontual, da punição. Com isso, é difícil avançar em uma discussão produtiva a respeito de "interdição" ou de "indicação" das denominadas técnicas punitivas para fins terapêuticos. Um dos prejuízos mais graves referentes a tal questão, conforme apontam Crosbie (1998) e Todorov (2001) é que os estudos na área ficam desencorajados, seja por comitês de ética, editores de periódicos ou pelo interesse dos próprios psicólogos na compreensão do fenômeno. Entretanto, pesquisas na área da punição e do controle aversivo em geral ainda são necessárias, já que punir ainda é uma prática amplamente utilizada na sociedade (Todorov, 2001). Ou seja, pesquisas são necessárias porque punições estão ocorrendo de forma não planejada e não avaliada (Vollmer, 2002); porque seu conhecimento aplicado com humanos ainda mostra-se insuficiente (Lerman & Vorndram, 2002) e porque precisamos fundamentar cientificamente nossos posicionamentos, tanto em relação à sua recomendabilidade, quanto à sua interdição (Iwata, 1988).

Por outro lado, Perone (2003) pontua que muitos procedimentos atualmente utilizados em Psicoterapia e em Educação, e que parecem trazer benefícios aos clientes e aos educandos em geral, poderiam ser, se analisados com rigor, definidos como punitivos ou aversivos. Mas, como tradicionalmente recebem outras denominações, são utilizados como se não o fossem e, assim, não são nem criticados, nem rejeitados. Um exemplo por ele citado é o uso da extinção. Outro exemplo é o time-out, amplamente divulgado no campo da Educação e que pode ser considerado uma forma da denominada "punição negativa".

Entendemos que esse autor chama atenção para o fato de que é preciso distinguir o procedimento (ou a técnica) de punição, criticada amplamente por Skinner (1953/2003, 1968/1972) de outros procedimentos que inevitavelmente possam conter elementos aversivos. O que Skinner critica é a técnica utilizada por diferentes agentes sociais de forma humilhante e desrespeitosa, visando dominar pessoas em benefício próprio, sem que elas possam opinar ou escolher outra alternativa de ação, nem serem beneficiadas por submeter-se a tais procedimentos (Griffin, Paisey, Stark, & Emerson, 1988). Isso se contrapõe aos estudos descritos por Lerman e Vorndram (2002), nos quais pacientes com deficits comportamentais graves se beneficiam de punições feitas de forma respeitosa e que lhes permitem substituir comportamentos bizarros por outros com os quais passam a ter acesso a interações sociais mais reforçadoras e, principalmente, a serem mais respeitados.

De qualquer modo, fica aqui aberta a discussão do que fazer com a terminologia da punição; um tema que nos parece inevitável ao analista do comportamento, uma vez que a punição consta em praticamente todas as publicações que tratam dos "princípios básicos" de Análise do Comportamento.

Sobre a exclusão do hedonismo

Em Ciência e Comportamento Humano, Skinner (1953/2003) assume uma posição não hedonista, contrária à posição de Thorndike, para explicar porque o reforçador reforça. Alinhados com essas primeiras posições de Skinner, analistas do comportamento, em geral, têm evitado a defesa da tese hedonista, seja para o prazer que acompanha o reforço positivo, seja para o alívio da dor ou do sofrimento que acompanha o reforço negativo. Mas Abib (2007) retomou, de certo modo, a defesa do hedonismo afirmando que parte dos argumentos de Skinner para refutá-lo não são aceitáveis. No livro Comportamento e Sensibilidade, Abib (2007) diz que é preciso esclarecer alguns pontos defendidos por Skinner, especialmente em relação ao modelo de "seleção pelas conseqüências" e, desse modo, esclarecer como a tese hedonista do reforço pode ser compatível com esse modelo explicativo do comportamento, embora não seja apropriada para a demonstração de leis em pesquisa experimental. Nesse livro, Abib tece um exame detalhado da argumentação skinneriana, impossível de ser aqui reproduzido. Sendo assim, serão apresentados aqui, sucintamente, apenas o que parece ser os dois focos principais do seu exame: as explicações conforme o modelo de seleção pelas conseqüências e as justificativas no contexto da Análise Experimental.

Em relação ao primeiro foco, Abib (2007) pontuou que, nas publicações posteriores a 1953, Skinner demonstrou uma espécie de "flerte" com o hedonismo. Isso ficou claro em suas análises do modelo de seleção por conseqüências, por exemplo, quando ele afirmou que, ao alimentar-se ou praticar sexo, um organismo vivo pode comportar-se sob o controle de duas conseqüências sobrepostas: uma com valor de sobrevivência (o alimento com valor para o organismo e o sexo para a espécie) e outra com valor reforçador (o alimento pelo sabor agradável na boca e o sexo pela apreciação dos corpos). As afirmações skinnerianas desse tipo sugerem, diz ele, dois tipos de sensibilidade às conseqüências, uma natural com valor biológico de sobrevivência e outra reforçadora, sem valor de sobrevivência biológica, apenas com valor estimulacional. Ambas as sensibilidades são imediatas e evoluídas, mas são sensibilidades distintas. No entanto, apesar de fazer várias afirmações semelhantes às afirmações acima, Skinner nunca admitiu que o reforçador reforça porque alivia a dor ou porque dá prazer, mesmo admitindo que as sensações de prazer ou de alívio acompanham o fortalecimento do comportamento (acompanham o aumento na probabilidade de respostas). Ao contrário, Skinner sempre atribuiu, de um modo ou de outro, algum valor biológico aos reforçadores primários. Mas Abib (2007) demonstra que seus argumentos em defesa do valor biológico para as conseqüências reforçadoras são inaceitáveis e que o próprio Skinner mostra que práticas culturais ocidentais (referindo-se ao consumismo capitalista exacerbado) que exploram a sensibilidade imediata às conseqüências reforçadoras podem ser letais. Isto é, elas podem ser letais justamente porque não se definem por valor biológico ou de sobrevivência.

Ao final de toda a sua argumentação para esclarecer o que ele considera alguns equívocos de Skinner a respeito da evolução de duas sensibilidades distintas, Abib (2007) afirma categoricamente:

As conseqüências naturais selecionam o comportamento filogenético porque têm valor de sobrevivência para os genes (...) os organismos, os grupos e as espécies. As consequências reforçadoras selecionam o comportamento operante porque têm valor hedonista, produzem sensações e sentimentos de prazer e alívio de dor, e não porque tenham valor de sobrevivência. As consequências culturais selecionam as práticas culturais porque têm valor de sobrevivência para os grupos e para as culturas (p.53-54).

O segundo foco do exame conduzido por Abib (2007) reside nos argumentos da utilidade dos critérios hedonistas na construção de leis científicas. Para esclarecer este ponto, ele afirma que é preciso fazer uma outra distinção, agora entre leis e teorias. Leis são descrições objetivas de relações funcionais para fins pragmáticos de controlar o comportamento; elas podem ser objetivamente demonstráveis e, por isso, permitem manipulação e controle de variáveis. Teorias são explicações que relacionam eventos, mas são relações inferidas dos dados observáveis que, no entanto, não podem ser diretamente demonstráveis, mensuráveis ou manipuláveis. As leis estão no plano observável, descritivo; as teorias estão no plano explicativo, conceitual e interpretativo.

Com base nos conceitos de leis e de teorias, Abib (2007) procura esclarecer, então, o que ele entende ser mais um erro de Skinner. Primeiro, ele concorda com Skinner no tocante a não recorrer ao hedonismo para interpretar as pesquisas sobre comportamento operante (seja com os gatos de Thorndike, com outros animais ou com humanos) uma vez que estas visavam a construção de leis. Isso porque, neste caso, não havia como demonstrar, experimentalmente, o efeito das sensações, pois não havia como medi-los. Portanto, no plano experimental. seus argumentos são aceitáveis. No entanto, Abib entende que o seu erro foi estender este argumento para o plano conceitual, teórico. Se Skinner admite, no plano conceitual, evidências de estados subjetivos, porque não admitir que o reforçador reforça por seus efeitos subjetivos, ainda que não se possa construir leis com base neles?

Em resumo, Abib (2007) defende que, no plano teórico, é possível sustentar uma tese hedonista do reforço, tendo como base o esclarecimento de alguns argumentos skinnerianos possivelmente equivocados: um, que mantém valor biológico para conseqüências reforçadoras, e outro, que transporta para o nível da explicação teórica, um problema que diz respeito apenas à construção de leis.

Considerações finais

Este ensaio foi uma tentativa de mostrar alguns aspectos históricos relevantes do esforço empreendido, por diferentes autores, na construção terminológica e conceitual do controle aversivo e, naturalmente, da Análise do Comportamento. A estratégia adotada foi contrapor, de um lado, algumas contribuições de Thorndike e de Skinner (com destaque para este) e, de outro lado, algumas divergências atuais, remanescentes. Nossa intenção, com essa estratégia, foi procurar demonstrar, com alguma clareza, dois pontos essenciais na construção de uma ciência: a busca por uma linguagem técnica apropriada e o interminável debate teórico, franco e direto. Não foi possível examinar em profundidade alguns temas complexos levantados na seção final, mas esperamos ter explanado o suficiente para, ao menos, indicar ao leitor uma pequena amostra da direção tomada por aqueles debates.

Referências

Abib, J. A. D. (2007). Comportamento e sensibilidade: Vida prazer e ética. Santo André: ESETec Editores Associados. [ Links ]

Azrin, N. H., & Holz, W. C. (1975). Castigo. In W. K. Honig (Org.), Conducta operante: Investigación y aplicaciones (pp. 455-531) (F. López, E. Galindo, & E. R. Iñesta, Trads.) México: Trillas (Trabalho original publicado em 1966). [ Links ]

Baron, A., & Galizio, M. (2005). Positive and negative reinforcement: Should the distinction be preserved? The Behavior Analyst, 28, 85-98. [ Links ]

Baum, W. (2006). Compreendendo o Behaviorismo: ciência, comportamento e cultura. Porto Alegre: Artmed (Trabalho original publicado em 1994). [ Links ]

Brown, J. F., & Hendy, S. (2001). A step towards ending the isolation of behavior analysis: A common language with evolutionary science. The Behavior Analyst, 24, 163-171. [ Links ]

Catania, A. C. (1968). Contemporary research in operant behavior. Glenview, IL: Scott, Foresman. [ Links ]

Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição. (D. G. Souza, Trad.). Porto Alegre: Artmed (Trabalho original publicado em 1998). [ Links ]

Chance, P. (1999). Thorndike 's puzzle boxes and the origins of the experimental analysis of behavior. Journal of the Experimental Analysis of Behavior, 72, 433-440. [ Links ]

Chase, P. N. (2006). Teaching the distinction between positive and negative reinforcement. The Behavior Analyst, 29, 113-115. [ Links ]

Chiesa, M. (1994). Radical behaviorism: The philosophy and the science. Boston: Authors Cooperative. [ Links ]

Crosbie, J. (1998). Negative reinforcement and punishment. In K. A. Lattal, & M. Perone (Eds.), Handbook of research methods in human operant behavior (pp. 163-189). New York: Plenum. [ Links ]

Cunha, R. S., Lorenzato, G. M., Ferraz, M. L., & Pinto, R. B. (2007). Processo penal prático: Fundamentos teóricos e modelos de peças de acusação e defesa (2a ed.). Salvador: JusPODIVM. [ Links ]

Dinsmoor, J. A. (2004). The etymology of basic concepts in the experimental analysis of behavior. Journal of the Experimental Analysis of Behavior, 82, 311-316. [ Links ]

Greco, R. (2008). Curso de direito penal: Vol. 1. Parte geral (10a ed.). RJ: Impetus. [ Links ]

Griffin, J. C., Paisey, T. J., Stark, M. T., & Emerson, J. H. (1988). B. F. Skinner's position on aversive treatment. American Journal on Mental Retardation, 93, 104-105. [ Links ]

Iwata, B. A. (1988). The development and adoption of controversial default technologies. The Behavior Analyst, 11, 149-157. [ Links ]

Iwata, B. A. (2006). On the distinction between positive and negative reinforcement. The Behavior Analyst, 29, 121-123. [ Links ]

Johnston, J. M. (1972). Punishment of human behavior. American Psychologist, 27, 1033-1054. [ Links ]

Keller, F. S., & Shoenfeld, W. N. (1974). Princípios de Psicologia. (C. M. Bori, & R. Azzi, Trads.) São Paulo: Herder (Trabalho original publicado em 1950). [ Links ]

Lerman, D. C., & Vorndran C. (2002). On the status of knowledge for using punishment: Implications for treating behavior disorders. Journal of Applied Behavior Analysis. 35, 431-464. [ Links ]

Mayer, P. C. M. (2009). Duas definições comportamentais de punição: História, conceitos e implicações. Dissertação de Mestrado, Departamento de Psicologia Geral e Análise do Comportamento, Universidade Estadual de Londrina, Londrina. [ Links ]

McConnell, J. V. (1990). Negative reinforcement and positive punishment. Teaching of Psychology, 17, 247-249. [ Links ]

Michael, J. (1975). Positive and negative reinforcement, a distinction that is no longer necessary; or a better way to talk about bad things. Behaviorism, 3, 33-44. [ Links ]

Michael, J. (2006). Comment on Baron and Galizio (2005). The Behavior Analyst, 29, 117-119. [ Links ]

Mulik, J. A. (1990). The Ideology and science of punishment in mental retardation. American Journal on Mental Retardation, 2, 142-156. [ Links ]

Perone, M. (2003). Negative effects of positive reinforcement. The Behavior Analyst, 26, 1-14. [ Links ]

Sidman, M. (2003). Coerção e suas implicações. (R. Azzi, & M. A. Andery, trads.) Campinas: Livro Pleno (Trabalho original publicado em 1989). [ Links ]

Sidman, M. (2006). The distinction between positive and negative reinforcement: some additional considerations. The Behavior Analyst, 29, 135-139. [ Links ]

Skiba, R. J., & Deno, S. (1991). Terminology and behavior reduction: The case against punishment. Exceptional Children, 57, 298-316. [ Links ]

Skinner, B. F. (1938). The behavior of organisms. New York: Appleton-Century-Crofts. [ Links ]

Skinner, B. F. (1972). Tecnologia de Ensino (R. Azzi, Trad.). São Paulo: Herder. (Trabalho original publicado em 1968). [ Links ]

Skinner, B. F. (1980). Contingências do reforço: uma análise teórica. (R. Moreno, Trad.) (Coleção Os Pensadores). São Paulo: Abril Cultural (Trabalho original publicado em 1969). [ Links ]

Skinner, B. F. (1982). Are theories of learning necessary? In R. Epstein, & B. F. Skinner (Ed.), Skinner for the classroom (pp. 41-72). Illinois: Research Press (Trabalho original publicado em 1950). [ Links ]

Skinner, B. F. (1983). A matter of consequences. New York: Knopf. [ Links ]

Skinner, B. F. (1986). What is wrong with daily life in the western world? American Psychologist, 41, 568-574. [ Links ]

Skinner, B. F. (1989). The Behavior of Organisms at Fifty. In B. F. Skinner, Recent issues in the analysis of behavior (pp. 121-135). Columbus, OH: Merrill. [ Links ]

Skinner, B. F. (2003). Ciência e comportamento humano. (J. C. Todorov, & R. Azzi, Trads.). São Paulo: Edart (Trabalho original publicado em 1953). [ Links ]

Spradlin, J. E. (2002). Punishment: A primary process? Journal of Applied Behavior Analysis, 35, 475-477. [ Links ]

Thorndike, E. L. (1911). Animal intelligence. New York: Macmillan. [ Links ]

Thorndike, E. L. (1931). Human Learning. Cambridge: The M.I.T. Press. [ Links ]

Todorov, J. C. (2001). Quem tem medo de punição? Revista Brasileira de Terapia Comportamental e Cognitiva, 3, 37-40. [ Links ]

Vollmer, T. R. (2002). Punishment happens: some comments on Lerman and Vorndran 's review. Journal of Applied Behavior Analysis, 35, 469-473. [ Links ]

Weber, L. (2005) Eduque com carinho: equilíbrio entre amor e limites. Curitiba: Juruá [ Links ].

Endereço para correspondência:
Maura Alves Nunes Gongora
Rua Walter Motta Campos, 94, Cond. Vale das Araucárias
Londrina, PR. CEP: 86047-670
Fone: (43) 3342-7284. Fax: (43) 3371-4227
E-mail: maura@uel.br

Enviado em Maio de 2009
Revisado em Maio de 2010
Aceite final em Maio de 2010
Publicado em Junho de 2010

1 Dedicamos este artigo a nossa colega e co-autora Carolina, que faleceu recentemente [após a submissão para publicação] nos deixando, prematuramente, aos 28 anos de idade. A ela o nosso reconhecimento pela idéia de elaborar este texto e pelo seu esforço em construir o primeiro esboço que nos convenceu de que este artigo era viável.
2 Skinner usa, por vezes, o termo "comportamento" como sinônimo de "resposta". Adotamos o mesmo uso, em alguns trechos deste texto, para facilitar a compreensão das posições skinnerianas aqui apresentadas.