Respostas de observação mantidas por estímulos compostos em pombos

Benvenuti, Marcelo Frota Lobato; Tomanari, Gerson Yukio

Serviços Personalizados

Journal

artigo

Tradução automática

Indicadores

Acessos

Mais
Mais

Permalink

Acta Comportamentalia

versão impressa ISSN 0188-8145

Acta comport. vol.18 no.1 Guadalajara 2010

ARTÍCULOS

Respostas de observação mantidas por estímulos compostos em pombos¹

Observing responses maintained by compound stimuli in pigeons

Marcelo Frota Lobato Benvenuti²; Gerson Yukio Tomanari³

Universidade de Brasília²
Universidade de São Paulo³

RESUMO

Com o objetivo de analisar experimentalmente a manutenção de respostas de observação pela apresentação de estímulos compostos, quatro pombos foram expostos a um procedimento de tentativas discretas em que presença ou ausência de alimento ao fim da tentativa independia do responder. Bicar o disco de resposta tinha como única conseqüência a apresentação sucessiva de um de quatro estímulos compostos (cor e orientação de uma linha). Três fases foram realizadas, nas quais as propriedades discriminativas dos estímulos, residentes na orientação da linha, na cor ou em combinações cor/linha, foram manipuladas. O efeito da apresentação dos estímulos compostos sobre a emissão de respostas de observação foi transitório para três dos quatro sujeitos. Ao quarto sujeito, por ser o único pombo a apresentar consistentemente o responder de observação, foram feitas manipulações experimentais adicionais que buscaram avaliar os possíveis efeitos reforçadores de cada componente do estímulo composto isoladamente. Os dados sugerem que respostas de observação podem ser mantidas por estímulos discriminativos compostos estabelecidos pela combinação de dois elementos, no caso, cor e orientação da linha. Entretanto, trata-se de um repertório complexo e frágil que precisa ser analisado em busca de se identificar as condições propícias para se estabelecer os devidos controles de estímulos.

Palavras-chave: resposta de observação, estímulos compostos, reforço condicionado, controle de estímulos, pombos.

ABSTRACT

In order to experimentally analyze the maintenance of observing responses by compound stimuli, four fooddeprived pigeons were exposed to 50-s discreet-trial procedure under response-independent food delivery. A trial always started with the white light on the response key and could end with or without food presentation (p = 0.5). Pecks to the key could change the white color to a different stimulus according to the trial outcome: Red plus vertical line and green plus horizontal line signaled a trial that would end with food presentation; red plus horizontal line and green plus vertical line signaled a trial that would end without food presentation. Three phases were carried out, in which the discriminative properties of the stimuli (line orientation, color, or the combinations of color and line) were manipulated and analyzed with respect to their effects on the frequency of observing responses and stimuli production. The results showed that, when the compound stimuli were used, observing responses initially occurred, but decreased along the sessions. Manipulations on the stimulus control across different phases produced conditions in which observing responses were maintained by the compound stimuli, although for one single subject. This subject was exposed to additional manipulations that aimed to assess possible reinforcing effects of each component of the compound stimuli. Data suggest that observing responses may be maintained by discriminative stimuli established by the combination of two different components, that is, disk color and line orientation. However, it clearly is a complex and fragile repertoire that demands further analyses in order to identify the conditions necessary to establish a more efficient stimulus control.

Key words: Observing response, compound stimuli, conditioned reinforcement, stimulus control, pigeons.

As primeiras demonstrações experimentais dos efeitos de um reforçador condicionado sobre o comportamento foram realizadas no contexto de um procedimento de discriminação simples. Em Skinner (1938), uma determinada resposta (R1, "pressionar a barra") era reforçada apenas na presença de luz, estabelecendo a função discriminativa desta última. A função reforçadora da luz foi avaliada com a introdução de um segundo manipulando (R2, "puxar a corrente"). Na ausência da luz, respostas a esse manipulando tinham como conseqüência a produção da luz, diante da qual R1 era reforçada pela apresentação de alimento.

Posteriormente, Wyckoff (1952) delineou um procedimento alternativo por meio do qual estudou as funções reforçadoras e discriminativas de estímulos. Nesse trabalho, pombos bicavam uma chave de respostas (Rx) sob condição de esquema misto (i.e., na ausência de estímulos discriminativos). Pressionando um pedal (Ry), os pombos transformavam o esquema misto em múltiplo (i.e., na presença de estímulos discriminativos), expondo-os à possibilidade de bicar sob controle de estímulos. Um ponto importante no procedimento de Wyckoff é que a resposta ao pedal, que produzia estimulação relacionada aos dois componentes do esquema em vigor, não produzia qualquer alteração nas contingências de reforçamento primário em vigor para o responder no disco. Wyckoff chamou as respostas ao pedal de respostas de observação porque permitiam ao sujeito o contato com os estímulos discriminativos das diferentes contingências em vigor (para uma descrição detalhada do procedimento e de suas implicações, ver Wyckoff, 1952, 1959, 1969).

Dinsmoor (1983) considerou o procedimento de resposta de observação a melhor técnica disponível para demonstrar a legitimidade e a importância da noção de reforçamento condicionado. No procedimento de respostas de observação, é possível a ocorrência e o fortalecimento da resposta que tem como conseqüência a apresentação de estímulos discriminativos, ainda que a mesma não exerça qualquer papel direto na produção do reforçador primário.

O procedimento de resposta de observação tem sido empregado para investigar o papel de estímulos discriminativos de presença (S+) e ausência (S-) de reforçamento na manutenção de respostas de observação. Esses estudos têm subsidiado a discussão de diferentes teorias sobre reforçamento condicionado, duas das quais se polarizam e se destacam: a teoria da redução do atraso (Fantino, 1977; Fantino & Logan, 1979; Fantino, Preston, & Dunn, 1993) e a teoria da redução da incerteza (Berlyne, 1957; Hendry, 1969). Procedimentos de resposta de observação têm utilizado um, dois ou três manipulandos. No procedimento com um manipulando, a apresentação do reforçador primário independe do responder. Respostas de observação, em tentativas discretas que terminam com ou sem alimento (ou com outros reforçadores, como pontos), podem produzir estímulos relacionados ao programado para o fim da tentativa. Esse procedimento foi utilizado com pombos (Blanchard, 1975; Kendal, 1973a, 1973b; Tomanari, 1997, 2001, 2008; Tomanari, Machado, & Dube, 1998), com ratos (Tomanari, 1996), com macacos (Schrier, Thompson, & Spector, 1980) e com humanos (Tomanari, 2004).

O procedimento que emprega dois manipulandos é basicamente aquele originalmente utilizado por Wyckoff (1952), no qual respostas de observação e respostas que produzem o reforçador principal (e.g., água ou alimento) se distinguem. O procedimento foi usado com pombos (Allen & Lattal, 1989; Auge, 1973, 1974; Branch, 1970, 1973; Dinsmoor, Bowe, Green, & Hanson, 1988; Dinsmoor, Browne, & Lawrence, 1972; Dinsmoor, Mulvaney, & Jwaideh, 1981; Hirota 1972; Jenkins & Broakes, 1973; Kendall, 1974; Muller & Dinsmoor, 1984, 1986) e com ratos (Carvalho & Machado, 1992; Preston, 1985). Em estudos com humanos, fazendo-se uso de reforçadores condicionados no lugar de água ou alimento, documenta-se a manutenção de respostas de observação nesse mesmo procedimento básico (Case & Fantino, 1981; Mulvaney, Hughes, Jwaideh & Dinsmoor, 1981; Tomanari et al., 2007).

Por fim, no procedimento com três manipulandos, vigora o esquema principal em um dos manipulandos. Nos outros dois, podem ser emitidas respostas que têm como conseqüência a produção de determinados estímulos no manipulando principal (S+ em um manipulando; S- no outro, por exemplo). Esse procedimento tem sido utilizado principalmente com humanos (Case & Fantino, 1989; Case, Fantino, & Wixted, 1985; Case, Ploog, & Fantino, 1990; Fantino & Case, 1983; Fantino, Case, & Altus, 1983; Perone & Baron, 1980; Perone & Kaminski, 1992), mas também foi empregado com pombos (Jwaideh & Mulvaney, 1976; Mulvaney, Dinsmoor, Jwaideh, & Hughes, 1974; Roper & Zentall, 1999) e ratos (Roper & Baldwin, 2004).

Em todas as variações documentadas no procedimento de resposta de observação, é constante o fato de que as funções discriminativas dos estímulos são estabelecidas com base em características físicas simples e invariantes do estímulo. Por exemplo, a cor vermelha do disco ou a freqüência alta do som corresponderia sistematicamente a períodos de alta probabilidade de reforçamento, ao passo que a cor verde ou a freqüência baixa corresponderia a uma baixa ou nula probabilidade de reforçamento.

Relação invariante entre estímulos e probabilidade de reforço é tipicamente encontrada em estudos de discriminação simples (Cumming & Berryman, 1965). Um estímulo, seja o S+, seja o S-, possui uma série de diferentes dimensões que podem exercer diferentes graus de controle sobre o comportamento. Em um procedimento de discriminação simples, todas as dimensões que caracterizam ambos, S+ e S-, estão invariavelmente relacionadas às mesmas probabilidades de reforçamento.

Cumming e Berryman (1965) mostram que a unidade de três termos que descreve a contingência básica resposta/reforçador sob controle de estímulos pode ser colocada sob controle de um quarto elemento ambiental. Nesse caso, em procedimentos de discriminação condicional, a função de um estímulo S+ ou S- dependeria da apresentação do denominado estímulo condicional. Nesse caso, a relação entre um determinado estímulo e o reforçamento não seria invariante, mas condicional à apresentação de outros estímulos. Em um procedimento típico, a função de S+ ou de S- em um par de estímulos, por exemplo, S1 e S2, dependeria da apresentação de um de dois estímulos condicionais, por exemplo, C1 e C2. Quando C1 é apresentado, a escolha de S1 seria reforçada, mas não a escolha de S2. Por outro lado, quando C2 é apresentado, a escolha de S2 seria reforçada, mas não a de S1.

A situação experimental para estudo da discriminação condicional exige pelo menos quatro estímulos ou quatro dimensões, componentes de estímulos, combinados em pelo menos quatro pares, sendo que nenhum estímulo ou componente, isolado, possa estar invariavelmente relacionado com o reforço. Nesse caso, as propriedades discriminativas dos estímulos passam a residir na combinação entre componentes. Os estímulos ou componentes dos estímulos podem ser apresentados sobrepostos (Lashley, 1938) ou separadamente, como é o caso do procedimento de pareamento ao modelo (ou matching to sample, em inglês, conforme Cumming & Berryman, 1961; Ferster, 1960).

Os estudos na área de resposta de observação têm explorado e atestado as funções reforçadoras condicionadas de estímulos cujos aspectos discriminativos são invariantes. Seriam respostas de observação igualmente mantidas por estímulos compostos cujos componentes não mantivessem relações invariantes com probabilidades de reforço? A análise dessa questão ajudaria a identificar fontes de controle do comportamento por estímulos que não são facilmente verificadas nos procedimentos para o estudo do controle de estímulos complexo, tais como, por exemplo, eventuais controles restritos por componentes isolados dos estímulos que resultem em desempenhos indiscriminados.

Ohta (1987) avaliou experimentalmente a possibilidade de que combinações entre componentes de estímulos compostos (e não seus componentes isolados) possam manter respostas de observação. Utilizando pombos privados de comida, delineou um experimento com tentativas discretas no qual dois de quatro componentes de estímulos poderiam ser combinados em um disco de respostas formando estímulos visuais compostos. Os estímulos utilizados foram formados por orientações de linhas (vertical e horizontal) e cores (azul e vermelha), constituindo quatro combinações possíveis entre linha e cor. Ao longo de diferentes fases, dois estímulos compostos cor/linha foram relacionados com o reforçador, enquanto outros dois estímulos compostos foram relacionados com 3 s de escurecimento da caixa.

Cada fase do experimento continha sempre um treino de discriminação condicional e um teste no procedimento de resposta de observação. No treino de discriminação condicional, cada tentativa era iniciada com a apresentação de um estímulo composto cor/linha. Diante de duas das quatro possíveis combinações cor/linha, o responder ao disco era reforçado com apresentação de alimento. Diante das outras duas combinações cor/linha, respostas ao disco postergavam a tentativa até que o pombo não apresentasse a resposta de bicar durante cinco segundos. No teste de observação, cada tentativa era iniciada com o disco de resposta iluminado pela cor verde. Uma resposta, definida como resposta de observação, produzia a mudança na cor do disco, em VI 10 s, de verde para azul ou vermelho a depender da presença ou ausência de comida na tentativa. Quarenta e cinco segundos depois do início da tentativa, tendo sido produzida a mudança na cor do disco ou não, uma das linhas era apresentada. As combinações cor/linha relacionadas com alimento ou escurecimento da caixa eram as mesmas da fase anterior. Diante de combinações "positivas", como denominou o autor, respostas eram reforçadas com alimento de acordo com o esquema FI; diante de combinações "negativas", respostas não eram reforçadas. Diante da ausência de respostas de observação, a combinação cor/linha aparecia no disco independentemente do comportamento do pombo e o esquema FI para a obtenção do alimento entrava em vigor. Em algumas fases, a função "positiva" de um estímulo cor dependia da (era condicional à) apresentação do componente linha (horizontal ou vertical). Em outras fases, um dos componentes linha era definido como S+ a despeito da cor (de maneira que a apresentação da cor seria "redundante"). A freqüência de respostas de observação foi maior na condição em que a produção da cor não era "redundante" no que diz respeito à produção de alimento ou o escurecimento da caixa.

A partir desses resultados, Ohta (1987) concluiu que respostas de observação podem ser mantidas pela produção de combinações de componentes de um estímulo composto, e não apenas por aspectos isolados dos mesmos. Assim, estímulos compostos podem atuar como reforçadores condicionados para as respostas de observação, mesmo que nenhum dos componentes dos compostos estejam invariavelmente relacionado com a probabilidade de apresentação do reforço primário. As conclusões de Ohta (1987) foram logo depois fortalecidas por resultados de Ohta (1988) obtidos em um procedimento concorrente encadeado.

Ohta (1987) analisou principalmente a freqüência de respostas de observação nas diferentes fases de seu experimento para basear suas conclusões. Contudo, uma análise do desempenho dos sujeitos ao longo das sessões mostra que as respostas de observação tenderam a se enfraquecer ao longo de cada fase. Para muitos sujeitos, a freqüência de respostas de observação ao fim das sessões de teste diminuiu, sistemática ou assistematicamente, em relação ao que vinha sendo obtido nas sessões iniciais. Esse enfraquecimento marcante das respostas de observação pode, portanto, dever-se a fatores não controlados experimentalmente. Uma hipótese é a de que as respostas de observação estivessem se mantendo no início da etapa de teste de observação simplesmente em função da história experimental imediatamente anterior, em particular em função do treino de discriminação condicional que antecedeu a introdução do procedimento de resposta de observação.

Levando-se em conta a relevância das questões identificadas por Ohta (1987), a presente investigação buscou analisar as respostas de observação que têm como consequência estímulos discriminativos compostos, porém empregou um contexto experimental relativamente simplificado no qual o alimento era apresentado independentemente de qualquer resposta dos pombos. Dessa forma, são minimizados possíveis efeitos mútuos entre respostas de observação e respostas que produzem alimento. Para aproximar o delineamento do presente estudo àqueles que investigam controle de estímulos complexo (e.g., Cumming & Berryman, 1961, 1965), serão utilizados estímulos compostos em que cada um de seus componentes nunca esteja invariavelmente relacionado com a disponibilidade ou não do alimento. Estímulos compostos assim configurados manteriam respostas de observação sob procedimento de reforçamento por alimento independente de resposta? Em caso positivo, os componentes que constituem o estímulo discriminativo composto exerceriam funções reforçadoras sobre as respostas de observação?

Método

Sujeitos

Foram utilizados quatro pombos experimentalmente ingênuos (P29, P30, P31 e P35), obtidos de criadores particulares, com cinco meses de vida no início da coleta de dados. Os sujeitos foram mantidos no biotério de pombos do Instituto de Psicologia da Universidade de São Paulo em gaiolas individuais. Durante o experimento, os pombos foram mantidos a 80% de seus pesos ad libitum por meio de restrição de acesso a alimento. Com base no consumo durante a sessão experimental, alimentação adicional podia ser fornecida aos sujeitos. Acesso à água foi livre durante todo o tempo de coleta.

Equipamento

Foram utilizadas duas caixas de condicionamento operante para pombos Med Associates, modelo ENV-08, mantidas no interior de caixas de isolamento acústico. Ambas as caixas encontravam-se equipadas com luz ambiente e comedouro que, normalmente, permanecia fora do alcance dos pombos. Quando acionado, o comedouro era iluminado e permitia acesso a grãos. Logo acima do comedouro, na mesma parede da caixa, havia um disco de respostas, central, de acrílico translúcido pelo qual podiam ser exibidas linhas, cores e formas por meio do projetor de estímulos modelo ENV-130M.

No presente experimento, o disco de respostas foi iluminado em toda sua área pelas cores branca, vermelha e verde, às quais podiam se sobrepor uma linha branca com orientação horizontal ou vertical, formando o que denominaremos de estímulos compostos. Quando somente a orientação da linha era projetada, na ausência de cores, o disco permanecia apagado e a linha era exibida em fundo preto.

As sessões experimentais foram programadas na linguagem MED PC. O programa permitia o registro do número de estímulos apresentados durante a sessão e das respostas emitidas ao disco central na presença de cada condição estimulatória no disco.

Procedimento

Treino Preliminar. Respostas de bicar o disco central da caixa iluminado pela cor branca foram modeladas pelo procedimento de auto modelagem (Brown & Jenkins, 1968). Depois de instaladas, as respostas de bicar o disco foram reforçadas em intervalo variável entre tentativas (IET) de 60 s. Cada tentativa da sessão começava com o disco de resposta iluminado pela cor branca e terminava com a apresentação ou com a ausência de (VI), cujos valores foram aumentados progressivamente ao longo das sessões (CRF, VI 10 s, VI 15 s, VI 30 s e VI 60 s) até que os pombos bicassem com frequências relativamente estáveis, avaliadas por inspeção visual, em VI 60 s.

Procedimento de Resposta de Observação. Os quatro pombos foram submetidos a um procedimento de resposta de observação formado por tentativas discretas. Cada tentativa tinha a duração mínima de 50 s e era separada da tentativa seguinte por um intervalo alimento independentemente de qualquer resposta (p=0,5). Nas tentativas com alimento, o comedouro era acionado por 3 ou 4 segundos (ver detalhamento adiante) e permanecia iluminado enquanto o alimento estava disponível; nas tentativas em que estava programada a ausência de alimento, a caixa era escurecida por um período correspondente ao tempo de acionamento do comedouro.

Durante as tentativas, respostas ao disco branco tinham como conseqüência a mudança na estimulação do disco de respostas. Os estímulos produzidos por respostas de bicar estiveram, ao longo das condições, relacionados diferencialmente com a apresentação ou não de alimento ao fim da tentativa. A Tabela 1 mostra os estímulos compostos utilizados nas sessões relativamente a cada tipo de tentativa em vigor. Na tabela, a sigla de cada tentativa indica a cor e a orientação da linha (VM = vermelho, VD = verde, V = linha vertical e H = linha horizontal). O sinal positivo ou negativo indica se o estímulo composto estava relacionado, respectivamente, à apresentação ou à ausência do alimento.

Uma vez apresentados no disco de respostas, os estímulos ficavam projetados até o final da tentativa. A seqüência de tentativas foi randomizada ao longo das sessões, com o único critério de que nunca houvesse mais do que três tentativas consecutivas que terminassem com ou sem alimento.

Para evitar a contiguidade envolvendo respostas ao disco e apresentação ou ausência do alimento, o encerramento de uma tentativa ocorria apenas na ausência de qualquer resposta ao disco por pelo menos 5 s (esquema DRO). Desse modo, os 50 s programados de cada tentativa poderiam se estender até que o pombo ficasse 5 s sem responder. Durante o período de vigência do esquema DRO, a contingência para a produção dos estímulos no disco de resposta era mantida, de forma que o DRO era sobreposto à contingência que estava em vigor na tentativa: uma resposta durante o DRO poderia simultaneamente produzir a apresentação dos estímulos no disco e estender a duração da tentativa por mais 5 s.

Esse procedimento básico foi utilizado sem alterações nas três fases experimentais descritas a seguir. Nessas, foram manipulados os valores do esquema para a produção do estímulo composto, a quantidade de estímulos compostos programados nas sessões (dois pares ou um par de estímulos compostos) e o procedimento de produção simultânea ou sucessiva dos componentes do estímulo composto. As contingências principais de cada fase são descritas a seguir. Alguns detalhes do procedimento, número de sessões e critérios para encerramento de fases são descritos na próxima seção, à medida que os resultados forem sendo apresentados.

As sessões experimentais foram conduzidas diariamente, seis dias por semana, no Laboratório de Análise do Comportamento da Universidade de São Paulo.

Fase I. Produção simultânea dos componentes dos estímulos compostos: aquisição e manutenção da resposta de observação

O objetivo desta fase foi avaliar se a apresentação de estímulos compostos poderia manter respostas de observação no procedimento básico já descrito. A estratégia geral envolveu apresentar os estímulos compostos contingentes a respostas ao disco branco durante as tentativas. Exigência para a produção dos compostos foi aumentada gradualmente. Com esse procedimento, ausência de respostas durante as tentativas implicaria no encerramento da tentativa na presença do disco branco no lugar dos estímulos compostos correspondentes às tentativas com alimento e sem alimento. Por esse motivo, uma das condições desta fase envolveu, na ausência de respostas, a apresentação dos estímulos compostos nos últimos segundos da tentativa independente do responder dos pombos (ver procedimento AEI abaixo).

Aquisição da resposta de observação em CRF

Respostas ao disco branco produziam a mudança na cor do disco sob reforçamento contínuo (CRF). Cada sessão foi programada com um número igual de tentativas de cada tipo, isto é, com e sem alimento (ver Tabela 1). Para P29, P30 e P31, as sessões foram programadas com 64 tentativas, 16 de cada tipo. P35 não foi submetido a essa etapa, por ter sido um pombo introduzido posteriormente no experimento para avaliar o efeito da história inicial dos três outros pombos.

Manutenção da resposta de observação em VI 10 s

O esquema CRF para a produção de mudança estimulatória no disco de resposta foi substituído pelo esquema VI. Nas sete primeiras sessões, esteve em vigor o VI 5 s, constituído pelos intervalos de 1, 4, 6 e 9 s, para produção de mudança estimulatória nas sessões de P29, P30 e P31. Posteriormente, respostas de observação passaram a ser consequenciadas com a apresentação dos estímulos compostos de acordo com o esquema VI 10 s, constituído pelos intervalos de 1, 5, 12 e 20 s. Durante uma mesma sessão, cada um dos valores era sorteado com a mesma freqüência para cada tipo de tentativa.

Procedimento com apresentação dos estímulos compostos independente de resposta (AEI)

Não ocorrendo respostas de observação, as tentativas encerravam-se com o disco iluminado pela cor branca, o que impedia a correlação dos estímulos compostos com a presença ou ausência de alimento. Com o objetivo possibilitar essa correlação, foi introduzido o procedimento AEI, na vigência do qual as tentativas sempre terminavam na presença dos estímulos discriminativos. Na ausência de respostas de observação, os estímulos programados eram apresentados, independentemente de qualquer resposta do sujeito, ao longo dos cinco últimos segundos da tentativa. Dessa forma, todas as tentativas terminavam com um dos quatro estímulos compostos projetados no disco de resposta.

A partir da primeira vigência do procedimento AEI, a luz da caixa passou a só estar acesa durante os IETs. Desse modo, durante as tentativas, somente havia a luz fornecida pela iluminação dos discos. Com isso, buscou-se salientar o início da tentativa, com o disco iluminado de branco, bem como os estímulos apresentados no disco de respostas.

Nas condições com e sem AEI, cada sessão era composta por 64 tentativas para P29, P30 e P31. Para P35, as sessões eram compostas por 32 tentativas.

Fase II. Produção simultânea dos componentes dos estímulos compostos: manipulação da quantidade de compostos em cada sessão (um par ou dois pares)

A Fase II teve por objetivo decompor e analisar as contingências vigentes na Fase I com vistas a especificar os controles vigentes sobre as respostas de observação. Ao avaliar o papel exercido por apenas um par de estímulos compostos sobre as respostas de observação, diferentemente dos dois pares usados na fase anterior, buscou-se identificar os requisitos para o exercício do controle complexo por estímulos.

Antes de iniciadas as sessões desta fase, os sujeitos P29, P30 e P31 passaram por sessões de reaquisição e manutenção da resposta de bicar o disco branco. Foi realizada uma sessão de CRF na qual as respostas de bicar o disco branco foram mantidas pela produção de alimento. Depois disso, respostas foram reforçadas em VI 30 s, por três sessões, e em VI 60 s, por mais duas sessões.

Em cada tentativa das sessões de respostas de observação, respostas ao disco branco produziam os estímulos compostos sob VI 10 s. Como na fase anterior, os dois componentes do estímulo composto eram apresentados simultaneamente no disco de respostas quando respostas ao disco cumpriam a exigência do VI.

As sessões iniciais desta fase foram programas com apenas dois tipos de tentativas dentre as quatro possíveis combinações entre os componentes dos estímulos compostos utilizadas na fase anterior. Metade das tentativas terminava com apresentação de alimento e a outra metade com o escurecimento da caixa. Embora os estímulos continuassem compostos, os pares de estímulos compostos em cada uma das sessões foram escolhidos para que um dos componentes, a cor ou a orientação da linha, estivesse relacionado com apresentação ou ausência de alimento. Dessa maneira, o outro componente do estímulo composto não teria papel discriminativo programado.

O procedimento da Fase II foi dividido nas seguintes etapas:

Etapa A. Sessões com tentativas VMV+ / VDV

As sessões foram programadas com 16 tentativas VMV+ e com 16 tentativas do tipo VDV-. No caso das sessões desta etapa, os estímulos apresentados em decorrência da emissão de respostas de observação continuavam formados por uma cor e uma orientação da linha branca. Contudo, a linha tinha sempre a orientação vertical, de maneira que a cor vermelha poderia exercer controle discriminativo acerca da apresentação do alimento ao fim da tentativa, enquanto a cor verde poderia exercer controle discriminativo do escurecimento da caixa.

Etapa B. Sessões com tentativas VDH+ / VMH

As sessões foram formadas por 16 tentativas do tipo VDH+ e 16 tentativas do tipo VMH-. A relação entre a cor e a presença ou ausência de alimento foi invertida em relação à etapa anterior. A cor verde, acompanhada pela linha com orientação horizontal, foi relacionada com as tentativas que terminavam com alimento. A cor vermelha, igualmente acompanhada pela linha com orientação horizontal, foi relacionada com as tentativas que terminavam com a ausência de alimento.

Etapa C. Sessões com tentativas VMV+ / VMH

Ao contrário do que ocorria nas etapas A e B, a dimensão relevante do estímulo foi a orientação da linha branca. A cor vermelha aparecia em todos os estímulos compostos. O estímulo formado pela cor vermelha e a linha vertical esteve relacionado com o alimento, enquanto o estímulo formado pela cor vermelha e a linha horizontal esteve relacionado com a ausência de alimento.

Etapa D. Sessões com tentativas VDH+ / VDV

A orientação da linha branca manteve-se relacionada com o alimento ou sua ausência no final de cada tentativa. A linha horizontal, acompanhada pela cor verde, esteve relacionada com a disponibilidade de alimento ao fim das tentativas. A linha vertical, acompanhada pela cor verde, esteve relacionada com ausência de alimento ao fim da tentativa.

Etapa E. Sessões com os quatro tipos de tentativas

As sessões foram programas com oito tentativas de cada tipo, VMV+, VDV-, VDH+, VMH-. Nesta etapa, as sessões foram planejadas de modo a replicar as condições básicas das sessões da Fase I.

Fase III. Produção sucessiva dos componentes dos estímulos compostos por respostas de observação

Apenas P29 foi utilizado como sujeito nesta fase, pois este foi o único dos sujeitos a apresentar respostas de observação consistentes nas fases anteriores em que os quatro estímulos compostos foram utilizados em uma mesma sessão. A racional desta fase foi avaliar se os componentes do estímulo composto manteriam, separadamente, respostas de observação e se isso dependia ainda da relação dos compostos com apresentação ou não do alimento. Respostas durante as tentativas produziram os componentes do estímulo composto separadamente, tendo sido um componente do estímulo apresentado por vez na tentativa. Respostas que cumpriam a exigência de um esquema VI 10 s durante cada tentativa produziam um dos componentes do estímulo composto programado para a tentativa. Quando o primeiro componente do estímulo composto era projetado no disco de respostas, um segundo esquema de VI 10 s entrava em vigor. Respostas que satisfaziam ao segundo esquema tinham como conseqüência a apresentação do segundo componente do estímulo composto, que era sobreposto ao componente que já estava projetado no disco de respostas. Todas as tentativas começavam com o disco branco. Respostas no disco branco poderiam produzir a linha vertical, a horizontal, a cor verde ou a cor vermelha. Qualquer uma das linhas poderia ser sobreposta a uma das cores, e qualquer uma das cores poderia ser sobreposta a uma das linhas. A relação entre estímulo composto e apresentação ou não de alimento ao final da tentativa foi a mesma da apresentada na Tabela 1. Mais uma vez, contudo, a relação entre componentes do composto e apresentação ou não de alimento ao fim da tentativa dependia da emissão de respostas ao disco durante as tentativas: na ausência de respostas de observação, as tentativas podiam terminar com o disco branco ou com apenas um dos componentes do estímulo composto projetado no disco.

As sessões foram programadas com 32 tentativas, com 8 tentativas do tipo VMV+, 8 do tipo VMH-, 8 do tipo VDV- e 8 do tipo VDH+. Cada tipo subdividido em dois, uma vez que cada uma das tentativas poderia começar com a apresentação da cor ou da orientação da linha. No caso da tentativa VMV+, por exemplo, em quatro tentativas, o primeiro componente do estímulo composto foi a cor vermelha e, em quatro outras, o primeiro componente foi a orientação vertical da linha branca.

O esquema para a produção do primeiro componente do estímulo composto foi sempre VI 10 s. O valor do esquema para a produção do segundo componente variou ao longo das sessões: VI 10 s, VI 6 s, VI 3 s, CRF ou extinção.

Na condição de extinção, foi removida a possibilidade de produção do segundo componente do estímulo composto. A situação experimental foi semelhante às demais, com a única diferença que o segundo componente do estímulo composto não era mais apresentado durante as tentativas. Respostas diante do disco branco podiam produzir a apresentação da linha vertical ou horizontal, ou ainda da cor verde ou vermelha, de acordo com o esquema VI 10 s. Em cada sessão, oito tentativas com cada um dos quatro componentes foram, portanto, planejadas. Das oito tentativas de cada tipo, quatro terminavam com alimento e quatro sem alimento.

A Tabela 2 resume as condições experimentais para os quatro pombos. Na tabela, também é apresentado o número de sessões em cada fase e as etapas experimentais realizadas.

Resultados

As Tabelas 3 e 4 dizem respeito às etapas com AEI e sem AEI da Fase I, na vigência de CRF (Tabela 3) e de VI (Tabela 4). Para análise do responder de observação mantido pela apresentação dos estímulos compostos, são apresentados: a) porcentagem de estímulos produzidos mediante respostas no disco branco e b) número de respostas no disco branco, ambos como médias das três sessões finais de cada condição.

Os dados apresentados na Tabela 3 permitem uma comparação do desempenho em CRF nas sessões com e sem AEI. A etapa de CRF sem AEI terminou com baixas porcentagens de produção de estímulos por resposta de observação e quase nenhuma resposta emitida. Na etapa com o procedimento AEI, (dados da Tabela 3 à direita), há mais respostas emitidas e, como conseqüência, há maior porcentagem de estímulos produzidos. O número de respostas é menor que o de tentativas, indicando que em algumas tentativas não houve resposta ao disco branco.

O efeito da introdução do VI pode ser examinado com a inspeção dos resultados apresentados na Tabela 4, na qual aparecem também resultados de P35. Comparando os resultados da Tabela 3 com os da Tabela 4, é possível notar que houve aumento tanto da porcentagem quanto do número de respostas no final da primeira condição (VI 10 s com AEI), relativamente ao desempenho verificado sob CRF. Nas duas condições seguintes, contudo, ao final, o número de respostas no disco branco se reduziu e houve consequente diminuição na porcentagem de estímulos produzidos.

O procedimento AEI parece ter tido, portanto, um efeito apenas transitório. No início de cada condição, o responder ao disco branco era mais freqüente e eram produzidos quase todos os estímulos compostos programados. P29, por exemplo, produziu 61 dos 64 estímulos programados na primeira sessão com o VI 10 s com AEI, tendo emitido 175 respostas no disco branco (dados não mostrados na tabela). Na condição VI 10 s sem AEI, P30 produziu todos os 64 estímulos compostos, tendo emitido 284 respostas (idem). Portanto, respostas no disco branco e porcentagem de produção de estímulos diminuíram com a continuidade da realização das sessões experimentais, independente de que novas variáveis tivessem sido manipuladas (no caso, introdução ou remoção do AEI, aumento da exigência para produção dos estímulos compostos).

A Tabela 5 mostra o resultado do procedimento empregado na Fase II para P29 e P30. O objetivo era decompor a tarefa da Fase I. Os dois sujeitos foram submetidos às etapas A, B e E. Depois de ter sido submetido à Etapa E, P30 foi submetido novamente às etapas A e B. O critério para encerramento das condições A e B era a porcentagem de estímulos produzidos por sessão igual ou acima de 90% em três sessões consecutivas, com exceção de P30 segunda exposição à Etapa A, cujo critério mínimo de estímulos produzidos foi de 85%.

Pode-se verificar na Tabela 5 que P29 atingiu todos os critérios de encerramento de condição, inclusive da Etapa E, que replicava as condições da Fase I. O número de respostas ao disco branco foi maior do que ocorrera nas condições anteriores para os dois pombos. P30 atingiu os critérios de encerramento na primeira vez em que foi submetido às etapas A e B, mas não na Etapa E. Na segunda vez em que P30 foi submetido às etapas A e B, o procedimento AEI foi introduzido depois da primeira sessão em que a porcentagem dos estímulos produzidos por sessão era menor do que 50%. Esse critério foi utilizado a partir de então para todos os sujeitos.

Quando, ao fim de 39 sessões da Etapa A, P30 produziu cerca de 85% dos estímulos compostos em cinco sessões consecutivas, foi encerrada a Etapa A e iniciada a segunda exposição à Etapa B. Depois de 39 sessões realizadas, P30 atingiu o critério para encerramento das sessões. Na segunda exposição às etapas A e B, o procedimento AEI foi introduzido depois da primeira sessão na Etapa A e depois de cinco sessões na Etapa B.

A Tabela 6 mostra os resultados da Fase II para os sujeitos que passaram pelas Etapas A, B, C, D e E, ou seja, P31 e P35. Como na Tabela 5, são apresentadas as médias de: porcentagem de estímulos produzidos por respostas e número de respostas nas três últimas sessões de cada etapa. Como havia sido observado para P30, P31 apresentou as menores porcentagens de estímulos produzidos por sessão na Etapa E. P35 não foi submetido à Etapa E, tendo apresentado porcentagens acima de 85% apenas na Etapa B.

A porcentagem de produção dos primeiros e segundos componentes do estímulo composto na Fase III para P29 e o número de respostas para cada configuração são analisados na Tabela 7. Como nas tabelas anteriores, os números apresentados são médias das três últimas sessões de cada etapa. Na Tabela 7, também é apresentado o par de esquemas VI segundo o qual a apresentação sucessiva de cada componente do estímulo composto foi planejada. Para a produção do primeiro componente, a única condição com porcentagens menores que 90% nas três últimas sessões foi a primeira, quando respostas de observação produziam os elementos do estímulo composto de acordo com o par de esquemas VI 10 s VI 10 s. Em todas as outras condições, a porcentagem nas últimas três sessões foi superior a 90%. As menores porcentagens de produção dos "segundos" componentes foram obtidas com os maiores valores de VI. Há também maior número de respostas para a produção dos "primeiros" componentes (i.e., respostas no disco branco) do que para a produção dos "segundos" componentes (i.é., respostas no primeiro componente). Isso pode ser explicado pelas próprias condições de treino às quais os sujeitos foram submetidos: não houve história de treino de bicar um componente projetado, ao passo que o treino de bicar o disco branco ocorreu desde as condições preparatórias para as fases experimentais. O número de respostas para a produção dos "segundos" componentes é semelhante ao final das diferentes condições; portanto, houve um menor número de estímulos compostos produzidos quando as contingências empregavam valores mais elevados do segundo VI.

A Figura 1 mostra o número de "primeiros" componentes do estímulo composto produzidos ao longo das sessões com o par VI 10 s EXT. Há um declínio gradual da porcentagem ao longo das sessões, seguido de posterior aumento até o final das 41 sessões da fase.

A Figura 2 mostra as respostas emitidas ao disco branco (gráfico superior) e as respostas diante do primeiro componente apresentado no disco (gráfico inferior). Em ambos os casos, o número de respostas foi calculado com base na oportunidade que o pombo tinha para responder sob cada condição estimulatória, posto que o responder sob o segundo componente do estímulo só ocorreria mediante a produção antecedente do primeiro. Para a produção do primeiro componente, o número de respostas foi dividido pelo número de tentativas da sessão; para a produção do segundo, portanto, o número de respostas foi dividido pelo número de primeiros componentes produzidos (i.e., pelo número de oportunidades que o pombo tinha, naquela sessão, de responder para produzir o segundo componente do estímulo composto). Nos dois casos, o número de respostas começou alto, nas primeiras sessões, e diminuiu a partir da décima sessão. Por volta da vigésima sessão, houve novo aumento. Da sessão 36 em diante, o número de respostas foi muito baixo, ocorrendo cerca de uma ou duas respostas por oportunidade.

Discussão

O objetivo do presente trabalho foi avaliar a possibilidade de que respostas de pombos fossem mantidas pela produção de estímulos compostos cujos elementos não estivessem invariavelmente relacionados à apresentação ou ausência de alimento. O procedimento escolhido para essa avaliação foi aquele em que respostas de observação produzem estímulos discriminativos de presença ou ausência de alimento independente de resposta.

De maneira bastante geral, os resultados mostraram uma frágil aquisição e manutenção da resposta de observação. Utilizando-se a porcentagem de produção de estímulos nas sessões e o número de respostas ao disco branco como medida, os resultados obtidos nas duas primeiras fases do estudo indicaram a dificuldade na aquisição e manutenção do responder pela produção dos estímulos compostos utilizados. Observada inicialmente a aquisição do responder de observação pela produção dos estímulos compostos, seguia-se um enfraquecimento gradual e constante.

A análise dos resultados mostrou que, a despeito da constatação mais geral sobre a dificuldade da aquisição e da manutenção da resposta de observação, a apresentação dos estímulos compostos pode ter fortalecido a resposta de observação em momentos específicos do estudo. Entre esses resultados, é possível destacar: a) o aumento das respostas de observação e consequente aumento na porcentagem de estímulos produzidos ao longo das sessões da Fase I. Esse parece ser o caso das condições em que o procedimento AEI foi utilizado pela primeira vez; b) o critério de desempenho na Fase II, isto é, a produção de 90% de estímulos compostos em três sessões consecutivas, foi alcançado em varias etapas. Esse resultado mostra que, frequentemente, na Fase II, os sujeitos estavam respondendo em VI 10 s, produzindo sistematicamente todos ou quase todos os estímulos compostos ao final de algumas sessões de determinada etapa; c) finalmente, é também uma forte evidência do fortalecimento da resposta de observação o desempenho de P29 como um todo ao longo do experimento, especialmente nas Fases II e III. Entretanto, trata-se de um repertório complexo e frágil que precisa ser analisado em busca de se identificar as condições propícias para se estabelecer os devidos controles de estímulos.

Os resultados da Fase II mostraram que é possível a manutenção do comportamento de observação quando um par de estímulos compostos é utilizado, replicando os resultados de outros estudos com pombos no procedimento de respostas de observação com apresentação de alimento independente de respostas (Blanchard, 1975; Kendal, 1973a; 1973b; Tomanari, 1997, 2001, 2008; Tomanari et al., 1998): quando o elemento crítico relacionado à apresentação ou à ausência de alimento é a cor ou a orientação da linha, respostas de observação são emitidas e mantidas. Os resultados de P29 mostram que a manutenção do comportamento de observação em uma situação em que dois pares de estímulos compostos são utilizados pode ser obtida decompondo-se a complexidade do estímulo em discriminações mais simples e diretas, como foi o caso da experiência com um par de estímulos S+ e S- em etapas sucessivas da Fase II. A fragilidade da resposta de observação observada apenas na Etapa E para P30 e P31, quando os dois pares de estímulos foram mais uma vez utilizados, contribui para localizar na complexidade da situação envolvendo dois pares de discriminações, a maior dificuldade para a manutenção do comportamento de observação. Os resultados obtidos na Fase II podem ser relacionados à discussão feita por Huguenin (2004), que expôs crianças com e sem atraso no desenvolvimento a um treino com estímulos compostos em que apenas um dos elementos era discriminativo para reforçamento ou extinção. Como no presente trabalho, Huguenin intercalou condições em que ora a propriedade discriminativa dos compostos residia na combinação de seus componentes, ora em apenas um dos componentes. Nas condições em que apenas um dos componentes funcionava como discriminativo, qual dos elementos do composto era o relevante foi sistematicamente mudado de modo que o sujeito respondesse aos dois em condições sucessivas. Nesse estudo, o autor demonstrou o controle simultâneo pelas partes componentes de estímulos compostos depois de extenso treino com a alternação dos critérios para reforço diferencial com base na combinação ou não dos componentes dos estímulos.

As dificuldades encontradas na aquisição e na manutenção da resposta de observação no presente trabalho podem ter advindo da dificuldade do estabelecimento de controle de estímulos exercido pelas configurações de estímulos compostos. Uma hipótese é que a situação com um par de estímulos compostos (vs. dois pares) produza mais facilmente controle discriminativo dos estímulos que, por sua vez, reforçarão respostas de observação que os produzam. Nesse caso, o estabelecimento de controle de estímulos na situação com dois pares de estímulos teria sido mais difícil de ser alcançada. Seguindo essa hipótese, cabe discutir como o procedimento empregado no presente estudo pode ter produzido controle de estímulos suficiente para que os estímulos compostos, e seus componentes, individualmente, pudessem também manter respostas de observação.

A análise do procedimento adotado pode ajudar a entender alguns dos resultados encontrados e sugerir alternativas para estudos posteriores para avaliação da manutenção de respostas de observação pela produção de estímulos compostos. Esses aspectos dizem respeito às contingências resposta-estímulo (RS) e estímulo-estímulo (SS) planejadas no experimento. As condições experimentais não envolveram qualquer contingência para a produção do alimento. A contingência RS em vigor envolvia respostas ao disco e apresentação dos estímulos compostos e seus elementos. Alimento foi apresentado independente do responder dos sujeitos, mantendo-se a relação estímulo composto – apresentação de alimento ou ausência de alimento.

Mesmo não havendo critério de reforço diferencial para a produção do alimento, é possível que tenha havido algum critério não explicitamente planejado de reforçamento diferencial ao longo das diferentes fases experimentais. Uma possibilidade tem relação com a ocorrência de respostas preparatórias relacionadas ao consumo de alimento: diante do S+, os pombos podem aproximar-se do alimentador e têm mais tempo de acesso quando os grãos são apresentados; diante do S-, podem deixar de responder ou engajamse em outras atividades (Tomanari, 2008).

Estímulos compostos, no presente estudo, foram relacionados com apresentação ou não de alimento. Essa contingência SS é bastante utilizada no contexto de investigação do condicionamento clássico ou pavloviano (Rescorla, 1988), porém os efeitos de contingências SS usualmente são avaliados sobre o comportamento eliciado por estímulos, não sobre comportamentos operantes. Os resultados do presente estudo parecem mostrar que contingências SS podem também gerar efeitos sobre respostas operantes que são fortalecidas por estímulos (condicionados). Vale destacar que a própria noção de reforço condicionado parece depender de como estímulos são relacionados, de modo que procedimentos com combinação de arranjos de contingências SS e RS podem ser especialmente importantes para esclarecer alguns pontos do processo de reforçamento condicionado.

Duas características dos procedimentos adotados podem ter contribuído para o enfraquecimento do responder de observação mantido pela apresentação de estímulos compostos. A primeira delas diz respeito ao modo como foram realizadas as fases preliminares: todos os pombos tiveram a resposta de bicar o disco branco reforçadas com alimento. Nas fases com o procedimento de observação, respostas ao disco branco produziam estímulos compostos e, ao fim das tentativas, os animais recebiam ou não alimento. O papel do disco branco nas contingências experimentais mudou da condição inicial para as condições de treino: no início, o disco branco estava relacionado com alta probabilidade de reforço; nas fases de treino, o papel do disco branco foi ambíguo, ora seguido de alimento, ora não. A segunda delas diz respeito à exigência de tempo sem resposta ao fim das tentativas para que os estímulos fossem apresentados. Essa exigência não parece prejudicar o responder de observação em estudos com estímulos simples e nos quais são planejadas relações invariantes entre estímulos e reforço primário (e.g., Tomanari, 1997). Contudo, é possível que essa decisão possa ter enfraquecido as respostas de observação no presente estudo, no qual o estímulo utilizado é mais complexo e, em algumas condições, são exigidos desempenhos em dois esquemas VI.

Os resultados do presente trabalho fortalecem a sugestão de que a investigação da função reforçadora condicionada de estímulos tem finas relações com as investigações sobre estabelecimento de controle de estímulos complexos. A própria dificuldade de manutenção da resposta de observação pelos estímulos compostos utilizados no presente estudo encontra paralelos com a dificuldade de estabelecimento de controle antecedente em discriminações complexas com sujeitos infra-humanos, com configurações semelhantes (e.g., Cumming & Berryman, 1961; Sidman, 1994). Desenvolver procedimentos para compreender como estímulos compostos podem ser estabelecidos como reforçadores pode ser importante para desenvolver procedimentos a partir dos quais os mesmos estímulos compostos podem gerar controle de estímulos complexo sobre o comportamento de organismos infra-humanos.

Os resultados da Fase III mostram que os elementos individuais dos estímulos compostos mantiveram respostas de observação à medida que os dois componentes dos estímulos compostos continuaram a eventualmente manter relação sistemática com alimento ou sua ausência. Esses resultados, em especial, sugerem que configurações complexas de estímulos podem ser utilizadas para reforçar diretamente respostas de sujeitos infra-humanos, fortalecendo a necessidade de avançar no desenvolvimento de procedimentos que acentuem o controle exercido por tais configurações.

REFERÊNCIAS

Allen, K. D., & Lattal, K. A. (1989). On conditional reinforcing effects of negative discriminative stimuli. Journal of the Experimental Analysis of Behavior, 52, 335-339. [ Links ]

Auge, R. J. (1973). Effects of stimulus duration on observing behavior maintained by differential reinforcing magnitude. Journal of the Experimental Analysis of Behavior, 20, 429-438. [ Links ]

Auge, R. J. (1974). Context, observing behavior, and conditioned reinforcement. Journal of Experimental Analysis of Behavior, 22, 525-533. [ Links ]

Berlyne, D. E. (1957). Uncertainty and conflict: A point of contact between information theory and behavior concepts. Psychological Review, 64, 329-333. [ Links ]

Blanchard, R. (1975). The effects of S- on observing behavior. Learning & Motivation, 6, 1-10. [ Links ]

Branch, M. N. (1970). The distribution of observing responses during two VI schedules. Psychonomic Science, 20, 5-6. [ Links ]

Branch, M. N. (1973). Observing response in pigeon: Effects of schedule component duration and schedule value. Journal of the Experimental Analysis of Behavior, 20, 417-428. [ Links ]

Brown, P. L., & Jenkins, H. M. (1968). Auto-shaping of the pigeon's key-peck. Journal of the Experimental Analysis of Behavior, 11, 1-8. [ Links ]

Carvalho, S. G., & Machado, L. M. C. M. (1992). Esquemas mistos e múltiplos concorrentes: uma reavaliação da resposta de observação. Acta Comportamentalia, 0, 109-144. [ Links ]

Case, D. A., & Fantino, E. (1981). The delay-reduction hyphothesis of conditioned reinforcement and punishment: observing behavior. Journal of the Experimental Analysis of Behavior, 35, 93-108. [ Links ]

Case, D. A., & Fantino, E. (1989). Instruction and reinforcement in the observing behavior of adults and children. Learning and Motivation, 20, 373-412. [ Links ]

Case, D. A., Fantino, E., & Wixted, J. (1985). Human observing maintained by negative informative stimuli only if correlated with improvement in response efficiency. Journal of the Experimental Analysis of Behavior, 43, 289-300. [ Links ]

Case, D. A., Ploog, B. O., & Fantino, E. (1990). Observing Behavior in a computer game. Journal of the Experimental Analysis of Behavior, 54, 185-199. [ Links ]

Cumming, W. W., & Berryman, R. (1961). Some data on matching behavior in the pigeon. Journal of the Experimental Analysis of Behavior, 4, 281-284. [ Links ]

Cumming, W. W., & Berryman, R. (1965). The complex discriminated operant: Studies of matching to sample and related problems. In D. I. Mostofski (Ed.) Stimulus Generalization (pp. 284-329). Stanford: Stanfort University. [ Links ]

Dinsmoor, J. A. (1983). Observing responses and conditioned reinforcement. The Behavior and the Brain Science, 6, 693-704. [ Links ]

Dinsmoor, J. A., Bowe, C. A., Green, L., & Hanson, J. (1988). Information on response requirement compared with information on food density as a reinforcer of observing in pigeons. Journal of the Experimental Analysis of Behavior, 49, 229-237. [ Links ]

Dinsmoor, J. A., Browne, M. P., & Lawrence, C. E. (1972). A test of the negative discriminative stimulus as a reinforcer of observing. Journal of the Experimental Analysis of Behavior, 18, 79-85. [ Links ]

Dinsmoor, J. A., Mulvaney, D. E., & Jwaideh, A. R. (1981). Conditioned reinforcement as a function of duration of stimulus. Journal of the Experimental Analysis of Behavior, 36, 41-49. [ Links ]

Fantino, E. (1977). Conditioned reinforcement: Choice and information. In W.K. Honig & J.E.R Staddon (Eds.). Handbook of Operant Behavior (313-339). New Jersey: Prentice Hall. [ Links ]

Fantino, E., & Case, D. A. (1983). Human observing: Maintained by stimuli correlated with reinforcement but not extinction. Journal of the Experimental Analysis of Behavior, 40, 193-210. [ Links ]

Fantino, E., Case, D. A., & Altus, D. (1983). Observing reward-informative and uninformative stimuli by normal children of different ages. Journal of the Experimental Analysis of Behavior, 36, 437-452. [ Links ]

Fantino, E., & Logan, C. A. (1979). The Experimental Analysis of Behavior: A Biological perspective. San Francisco: Freemen. [ Links ]

Fantino, E., Preston, R. A., & Dunn, R. (1993). Delay reduction: Current status. Journal of the Experimental Analysis of Behavior, 40, 193-210. [ Links ]

Ferster, C. B. (1960). Intermittent reinforcement of matching to sample in the pigeon. Journal of the Experimental Analysis of Behavior, 3, 529-530. [ Links ]

Hendry, D. P. (1969). Introduction. In D. P. Hendry (Ed.), Conditioned reinforcement (pp. 1-33). Homewood: Dorsey. [ Links ]

Hirota, T. T. (1972). The Wyckoff observing response: A reappraisal. Journal of the Experimental Analysis of Behavior, 18, 263-276. [ Links ]

Huguenin, N. H. (2004). Assessing visual attention in young children and adolescents with severe mental retardation utilizing conditional-discrimination tasks and multiple testing procedures. Research in Developmental Disabilities, 25, 155-181. [ Links ]

Jenkins, H. M., & Broakes, R. A. (1973). Observing stimulus sources that signal food or no food. Journal of the Experimental Analysis of Behavior, 20, 197-207. [ Links ]

Jwaideh, A. R., & Mulvaney, D. E. (1976). Punishment of observing response by a stimulus associated with the lower of two reinforcement densities. Learning and Motivation, 7, 211-222. [ Links ]

Kendall, S. B. (1973a). Redundant information in an observing-response procedure. Journal of Experimental Analysis of Behavior, 19, 81-92. [ Links ]

Kendall, S. B. (1973b). Effects of two procedures for varying information transmission on observing responses. Journal of Experimental Analysis of Behavior, 20, 73-83. [ Links ]

Kendall, S. B. (1974). Preference for intermittent reinforcement. Journal of the Experimental Analysis of Behavior, 21, 463-473. [ Links ]

Lashley, K. S. (1938). Conditional discriminations in rats. Journal of Psychology, 6, 311-324. [ Links ]

Muller, K. L., & Dinsmoor, J. A. (1984). Testing the reinforcement properties of S-: A replication of Lieberman's procedure. Journal of the Experimental Analysis of Behavior, 41, 17-25. [ Links ]

Muller, K. L., & Dinsmoor, J. A. (1986). The effect of negative stimulus presentations on observing-response rates. Journal of the Experimental Analysis of Behavior, 46, 281-291. [ Links ]

Mulvaney, D. E., Hughes, L. H., Jwaideh, A. R., & Dinsmoor, J. A. (1981). Differential production of positive and negative discriminative stimuli by normal and retarded children. Journal of Experimental Psychology, 32, 389-400. [ Links ]

Mulvaney, D. E., Dinsmoor, J. A., Jwaideh, A. R., & Hughes, L. H. (1974). Punishment of observing by the negative discriminative stimulus. Journal of the Experimental Analysis of Behavior, 21, 37-44. [ Links ]

Ohta, A. (1987). Observing responses maintained by conditional discriminative stimuli. Journal of the Experimental Analysis of Behavior, 48, 355-366. [ Links ]

Ohta, A. (1988). Conditioned reinforcement by conditional discriminative stimuli. Journal of the Experimental Analysis of Behavior, 49, 239-247. [ Links ]

Perone, M., & Baron, A. (1980). Reinforcement of human observing behavior by stimulus correlated with extinction or increased effort. Journal of the Experimental Analysis of Behavior, 34, 239-261. [ Links ]

Perone, M., & Kaminski, B. J. (1992). Conditioned reinforcement of human observing behavior by descriptive and arbitrary verbal stimuli. Journal of the Experimental Analysis of Behavior, 58, 557-575. [ Links ]

Preston, G. C. (1985). Observing response in rats: Support for the secondary hypothesis. The Quarterly Journal of Experimental Psychology, 37B, 23-31. [ Links ]

Rescorla, R. (1988). Pavlovian conditioning: It's not what you think it is. Americam Psychologist, 43, 151- 160. [ Links ]

Roper, K. L., & Baldwin, E. R. (2004). The two-alternative observing response procedure in rats: Preference for non-discriminative stimuli and the effect of delay. Learning and Motivation, 35, 275-302. [ Links ]

Roper, K. L., & Zentall, T. R. (1999). Observing in pigeons: The effect of reinforcement probability and response cost using a symmetrical choice procedure. Learning and Motivation, 30, 201-220. [ Links ]

Schrier, A. M., Thompson, C. R., & Spector, N. R. (1980). Observing behavior in monkeys (Macaca arctoides): Support for the information hypothesis. Learning and Motivation, 11, 355-365. [ Links ]

Sidman, M. (1994). Equivalence Relations and Behavior: A Research Story. Boston: Authors Cooperative. [ Links ]

Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. New York: Appleton-Century- Crofts. [ Links ]

Tomanari, G. Y. (1996). Observing responses in rats: Effects of different contingencies of reinforcement. Annual Meeting of the Association for Behavior Analysis. São Francisco. [ Links ]

Tomanari, G. Y. (1997). Manutenção de respostas de observação em pombos. Tese de Doutorado não publicada. Instituto de Psicologia, Universidade de São Paulo. [ Links ]

Tomanari, G. Y. (2001). Respostas de observação controladas por estímulos sinalizadores de reforçamento e extinção. Acta Comportamentalia, 2, 119-143. [ Links ]

Tomanari, G. Y. (2004). Human observing behavior maintained by S+ and S-: Preliminary data. International Journal of Psychology and Psychological Therapy, 4, 155-163. [ Links ]

Tomanari, G. Y. (2008). Respostas de observação: as principais questões na área analisadas a partir de três experimentos com pombos. Tese de Livre Docência não publicada. Instituto de Psicologia, Universidade de São Paulo. [ Links ]

Tomanari, G. Y., Balsamo, L. M., Fowler, T. R., Lombard, K. M., Farren, K. M., & Dube, W. V. (2007). Manual and ocular observing behavior in human subjects. European Journal of Behavior Analysis, 8, 29-40. [ Links ]

Tomanari, G. Y., Machado, L. M., & Dube, W. (1998). Pigeon's observing behavior and response-independent food presentations. Learning and Motivation, 29, 249-260. [ Links ]

Wyckoff, L. B. (1952). The role of observing responses in discrimination learning - Part I. Psychological Review, 59, 431-442. [ Links ]

Wyckoff, L. B. (1959). Toward a quantitative theory of secondary reinforcement. Psychological Review, 66, 68-78. [ Links ]

Wyckoff, L. B. (1969). The role of observing responses in discrimination learning. In D. P. Hendry (Org.). Conditioned Reinforcement (pp. 237-260). Homewood: Dorsey. [ Links ]

Received: May 1, 2009
Accepted: November 10, 2009

¹ Artigo baseado na tese de doutorado de Marcelo Frota Lobato Benvenuti defendida na Universidade de São Paulo (Psicologia Experimental) com orientação de Gerson Yukio Tomanari. O artigo foi escrito na vigência de bolsa de pós-doutorado para Marcelo Frota Lobato Benvenuti (PRODOC/CAPES) e na vigência de bolsa de Produtividades em Pesquisa para Gerson Yukio Tomanari (CNPq). Os autores agradecem as cuidadosas revisões e sugestões dos dois revisores anônimos. Endereço eletrônico para correspondência: Marcelo Frota Lobato Benvenuti, mbenvenuti@yahoo.com