Reforçamento da variabilidade comportamental na resolução de problemas

Leite, Emerson Ferreira da Costa; Micheletto, Nilza

doi:10.36482/1809-5267.ARBP2020v72i2p.204-220

Serviços Personalizados

Journal

artigo

Tradução automática

Indicadores

Acessos

Mais
Mais

Permalink

Arquivos Brasileiros de Psicologia

versão On-line ISSN 1809-5267

Arq. bras. psicol. vol.72 no.1 Rio de Janeiro jan./abr. 2020

https://doi.org/10.36482/1809-5267.ARBP2020v72i2p.204-220

ARTIGOS

Reforçamento da variabilidade comportamental na resolução de problemas

Reinforcement of behavioral variability in problems solving

Mayor variabilidad de comportamiento en la resolución de problemas

Emerson Ferreira da Costa Leite^I; Nilza Micheletto^II

^IDocente. Pontifícia Universidade Católica de São Paulo (PUC-SP). São Paulo. Estado de São Paulo. Brasil
^IIDocente. Programa de Pós-graduação em Psicologia Experimental: Análise do Comportamento. Pontifícia Universidade Católica de São Paulo (PUC-SP). São Paulo. Estado de São Paulo. Brasil

Endereço para correspondência

RESUMO

Foi objetivo investigar os efeitos do reforçamento do variar respostas precorrentes sobre a resolução de problemas envolvendo compor figuras pré-definidas, combinando cores, formas e localizações na tela do computador, com estudantes de 18 a 25 anos. Pontos foram dados por quaisquer composições formadas (condição QQ) e por variar respostas precorrentes na formação de composições (condição VAR). Em todas condições, maior pontuação foi apresentada por formar composições-alvo predefinidas, única contingência em vigor na condição Teste. Seis participantes foram expostos às condições na ordem QQ-VAR e seis na ordem inversa, antecedidas e seguidas por Teste. Em parte, eles formaram mais composições-alvo em menos tentativas durante VAR, mas observou-se um possível efeito de ordem das condições. Maiores níveis de variabilidade acompanharam maiores números de composições-alvo formadas e em menos tentativas, mostrando que variar respostas precorrentes facilitou a resolução de problemas.

Palavras-chave: Variabilidade de resposta; Criatividade; Solução de problemas.

ABSTRACT

The objective of this study was to investigate the effects of reinforcement of varying the precurrent responses on problem solving involving composing pre-defined figures, combining colors, shapes and locations on the computer screen, with students aged 18 to 25 years. Points were given by any compositions formed (QQ condition) and by varying precurrent responses in the formation of compositions (VAR condition). In all conditions, more points were presented for forming pre-defined target compositions, the only contingency present in the Test condition. Six participants were exposed to conditions in the QQ-VAR order and six in the reverse order, preceded and followed by Test. In part, they formed more target compositions in fewer trials during VAR, but a possible order-of-conditions effect was observed. Higher levels of variability accompanied larger numbers of target compositions formed and in fewer trials, showing that varying precurrent responses facilitated problem solving.

Keywords: Response variability; Creativity; Problem solving.

RESUMEN

El objetivo de este estudio fue investigar los efectos de refuerzo de las diferentes respuestas precoces en la resolución de problemas que involucran la composición de figuras predefinidas mediante la combinación de colores, formas y ubicaciones en la pantalla de la computadora con estudiantes de 18 a 25 años. Los puntos se puntuaron para cualquier composición formada (condición QQ) y para respuestas de precursor variables en la formación de la composición (condición VAR). En todas las condiciones, se presentó la puntuación más alta para formar composiciones de objetivos predefinidas, la única contingencia en vigor en la condición de Prueba. Seis participantes fueron expuestos a condiciones en el orden QQ-VAR y seis en orden inverso, precedidos y seguidos por la Prueba. En parte, formaron más composiciones de diana en menos intentos durante el VAR, pero se observó un posible efecto ordenador de las condiciones. Los niveles más altos de variabilidad siguieron a un mayor número de composiciones objetivo formadas y en menos intentos, lo que demuestra que las diferentes respuestas de los precursores facilitaron la resolución de problemas.

Palabras clave: Variabilidad de respuesta; Creatividad; Solución de problemas.

Introdução

Estudos experimentais têm apresentado a variabilidade como uma dimensão comportamental modificável pelo reforçamento (Doughty, Giorno & Miller, 2013; Neuringer, 2015). Nos experimentos de Page e Neuringer (1985), por exemplo, ratos receberam estímulos reforçadores apenas se emitissem sequências de respostas de pressão à barra que diferissem das n anteriores. Os resultados mostraram que esse esquema de reforçamento aumentou a variabilidade do comportamento dos sujeitos experimentais.

Outros estudos mostram, ainda, que o reforçamento direto de variação na emissão de diferentes tipos de respostas (por exemplo, montar blocos e respostas verbais) pode resultar no aumento da variabilidade comportamental e no surgimento de respostas novas, ou seja, que não haviam sido emitidas ao longo do estudo (Goetz & Baer, 1973; Guimarães & Micheletto, 2017). No estudo de Romano (2014), crianças autistas apresentaram respostas verbais novas quando foram expostas sucessivamente ao reforçamento somente de respostas variadas e depois de respostas novas, e também simultaneamente quando esses dois procedimentos ocorreram de maneira concorrente.

O surgimento de respostas novas (ou aumento de respostas pouco prováveis) durante o reforçamento da variabilidade foi explorado também em estudos nos quais se avaliou o efeito desse reforçamento concorrente ao reforçamento de sequências-alvo específicas, sobre a seleção dessas sequências-alvo (Grunow & Neuringer, 2002; Neuringer, 1993). No Experimento 1 do estudo de Neuringer (1993), por exemplo, após a linha de base, na qual a variabilidade de sequências de quatro respostas emitidas foi reforçada utilizando-se o esquema Lag 5 (que consistiu em reforçar respostas diferentes das cinco anteriores), foi reforçada cada emissão de sequências-alvo, escolhidas para cada sujeito por ocorrerem com baixa probabilidade durante a linha de base, concorrentemente ao reforçamento no Lag 5. Em relação à linha de base, o procedimento aumentou acentuadamente a frequência das sequências-alvo. A relação entre reforçamento da variabilidade e o surgimento de respostas novas tem levado a uma frequente associação deste procedimento ao fenômeno que se costuma chamar de criatividade. Embora o reforçamento direto da variabilidade não seja o único processo comportamental relacionado com o surgimento de comportamento novo, parece haver um consenso entre os autores de orientação analítico-comportamental de que comportamento novo é uma das características de comportamentos descritos como criativos, o que justifica a associação com o reforçamento do variar em algum tipo de tarefa (Shahan & Chase, 2002).

Uma questão ainda não investigada na literatura, é se o reforçamento da variabilidade de maneira concorrente ao reforçamento de respostas-alvo novas pode favorecer o surgimento destas. Determinar se o reforçamento da variabilidade favorece a "descoberta" de respostas novas que seriam reforçadas pode ser justificado como importante na medida em que Skinner (1969) sugere que comportamento criativo pode ser interpretado como a resolução de problemas para os quais não se conhecesse a resposta-solução nem suas consequências. De tal análise, pode-se compreender, ainda, que após a sua seleção, respostas novas podem passar a não ser mais consideradas criativas, o que torna relevante determinar o efeito do reforçamento do variar sobre o surgimento de respostas novas quando estas são reforçadas uma única vez e são substituídas ao longo do estudo.

Inserir o comportamento criativo no contexto da resolução de problemas também implica que esse comportamento inclua respostas manipulativas do ambiente (respostas precorrentes); tais respostas tornam mais provável o surgimento de comportamentos novos, que podem ser considerados criativos. Assim, o efeito do reforçamento contingente ao variar em respostas precorrentes durante a resolução de problemas também precisa ser explorado.

O objetivo do presente estudo foi investigar os efeitos do reforçamento do variar em respostas precorrentes sobre a resolução de problemas de composição de figuras. Buscou-se responder se o reforçamento de respostas precorrentes variadas facilitaria ou não a formação de composições-alvo novas, previamente determinadas. O reforçamento do variar teve seus efeitos ainda comparados ao reforçamento de quaisquer composições.

Método

Participantes

Participaram 12 estudantes, de ambos os sexos, de graduação em Psicologia e do Ensino Médio, com idades entre 18 e 25 anos e assinaram um Termo de Consentimento Livre e Esclarecido. O Comitê de Ética em Pesquisa com Humanos da Pontifícia Universidade Católica de São Paulo (PUC-SP) aprovou a pesquisa (Processo nº 2.698.650).

Equipamento

Um notebook com um software permitiu apresentar, na tela do computador, os estímulos antecedentes e consequentes da tarefa, que envolveu, a cada tentativa, compor formas coloridas em uma determinada localização na tela do computador.

Procedimento

Os participantes foram expostos a um pré-treino com seis tentativas em uma tarefa muito semelhante à utilizada no estudo, mas que envolvia outros estímulos e não produzia pontos. Encerrado o pré-treino, o experimentador deu a seguinte instrução ao participante:

Peço que se sente e jogue o jogo do computador. Leia as instruções que aparecerão na tela. Cada fase do jogo terá duração de aproximadamente uma hora, e enquanto joga você poderá ganhar pontos, que serão trocados por créditos de cinco centavos cada, em um cartão voucher da loja que você escolher. O cartão será entregue apenas no último encontro quando todas as fases forem encerradas. Se você tiver alguma dúvida pode me perguntar agora; e se algum problema surgir com o equipamento enquanto estiver jogando, você pode interromper e me procurar na sala ao lado".

Em todas as fases, a tarefa envolveu a apresentação randômica de três dimensões de estímulos, uma dimensão por vez, todas elas apresentadas a cada tentativa: forma (F), cor (C) e localização na tela (L). Cada dimensão foi composta por quatro estímulos diferentes randomizados entre si: triângulo (F1), círculo (F2), losango (F3) e pentágono (F4); vermelho (C1), amarelo (C2), verde (C3) e azul (C4); e superior esquerda (L1), inferior esquerda (L2), superior direita (L3) e inferior direita (L4), indicadas por uma seta na diagonal, apontando para a localização correspondente na tela. O objetivo principal da tarefa era clicar sobre os estímulos apresentados, formando composições com uma forma colorida em determinada localização da tela. Havia 64 composições possíveis. A Figura ilustra a sequência de telas do computador, com estímulos antecedentes (telas à esquerda), respostas dos participantes (setas nas telas à esquerda) e consequências (telas à direita) durante uma tentativa. Cada linha, de cima para baixo, apresenta um elo de uma tentativa. Foram representadas a tela inicial na primeira tentativa de cada fase (superior esquerda) e a tela final, comum a todas as tentativas, exceto pela composição específica formada pelo participante e o número de pontos obtidos (inferior direita). No quadrado preto, no canto inferior esquerdo, eram apresentados os pontos.

Cada fase iniciou-se com uma tela branca com um botão "Iniciar" e a instrução:

O objetivo do jogo é compor figuras com três características: localização, forma e cor. Para selecionar localizações, formas e cores você só precisa clicar sobre elas com o botão esquerdo do mouse. Algumas das composições produzidas por você lhe darão pontos trocáveis por créditos em seu cartão, outras composições não lhe darão pontos. O jogo pode durar até, aproximadamente, uma hora. Quando estiver pronto clique em "iniciar".

Para cada fase, oito composições foram previamente sorteadas. Essas composições foram consideradas as respostas "criativas" que solucionavam os "problemas" apresentados, e foram chamadas composições-alvo. As composições-alvo nunca se repetiram intra e entre fases e foram as mesmas para todos os participantes.

Em todas as fases, a primeira emissão de qualquer uma das oito composições-alvo foi reforçada com cinco pontos, apresentados no contador, acompanhados de um som, e a mudança do contador para a cor roxa. Os participantes eram informados do total de pontos obtidos ao final de cada uma das fases, que foram encerradas quando formadas as oito composições-alvo ou após 200 tentativas, o que ocorresse primeiro.

O delineamento envolveu expor cada participante a duas condições experimentais: reforçamento de respostas precorrentes variadas (VAR) e reforçamento de quaisquer composições formadas (QQ), em duas fases que foram precedidas e seguidas por testes (T1, T2 e T3). As condições foram apresentadas em diferentes ordens entre os participantes para isolar possíveis efeitos da ordem de apresentação: P1 a P6 passaram pelas condições na ordem T1-QQ-T2-VAR-T3, e P7 a P12 na ordem T1-VAR-T2-QQ-T3.

Condição de Teste (T1, T2 e T3). Cinco pontos foram obtidos ao final da tentativa apenas por formar uma das oito composições-alvo. Formar outras composições foi seguido somente pelo início de nova tentativa. Buscou-se avaliar o padrão comportamental dos participantes enquanto formavam as composições composições-alvo, antes e depois das condições VAR e QQ.

Condição VAR. Reforçamento de respostas precorrentes variadas. Respostas a cada uma das três dimensões (cor, forma ou posição) de estímulos (respostas precorrentes) componentes da tarefa foram reforçadas, com um ponto cada, se diferissem das duas respostas anteriores na mesma dimensão de estímulos (Lag 2) - por exemplo, selecionar uma cor que fosse diferente das duas selecionadas anteriormente produzia um ponto, o mesmo ocorria ao selecionar forma ou posição diferente das duas anteriores selecionadas. Ao formar pela primeira vez cada uma das oito composições composições-alvo, o participante recebeu cinco pontos. Buscou-se avaliar os efeitos do reforçamento direto do variar respostas precorrentes sobre a formação de composições composições-alvo.

Condição QQ. Reforçamento de quaisquer composições formadas. Todas as composições formadas pelos participantes foram reforçadas com três pontos ao final da tentativa, independentemente de serem variadas ou repetidas em relação às composições já formadas. Concomitantemente, a cada uma das oito composições-alvo formada pela primeira vez, o participante recebeu mais cinco pontos. Buscou-se avaliar os efeitos do reforçamento de qualquer composição formada (ou seja, sem exigir que as respostas precorrentes variassem), sobre a formação de composições composições-alvo de forma, cor e localização definidas como corretas.

Resultados

O objetivo do estudo foi avaliar os efeitos do reforçamento da variabilidade de respostas precorrentes de seleção de cores, formas e localizações que permitiam formar figuras com estas dimensões na tela do computador (VAR) e do reforçamento de quaisquer composições formadas (QQ) sobre a formação de composições-alvo novas (ou seja, emitidas pela primeira vez em uma dada fase do estudo) sorteadas previamente (solução de problemas). Para tal, foram comparadas medidas de variabilidade - porcentagem de tentativas com composições diferentes em cada fase - e de solução de problemas - total de composições-alvo formadas em cada fase e o número acumulado de composições-alvo formadas nas tentativas de cada fase.

No Gráfico 1 apresenta-se a porcentagem de tentativas com composições diferentes formadas (barras) em cada uma das cinco fases experimentais, calculada pela divisão do número de tentativas com composições diferentes pelo total de tentativas da fase. Apresentam-se também os números totais de composições-alvo (linhas) formadas em cada fase. Na coluna de painéis à esquerda estão representados os resultados de P1 a P6, expostos às condições na ordem QQ-VAR; e na coluna da direita, os de P7 a P12, expostos às condições na ordem inversa.

Como podemos observar no Gráfico 1, todos participantes formaram composições diferentes em pelo menos 20% das tentativas em cada fase, e esse valor não ultrapassou 60% para quase todos eles, com exceção do P10, cujas porcentagens variaram de 80% a 100%. Quando comparadas as porcentagens nas cinco fases, não se identifica uma tendência nos valores obtidos, as medidas obtidas diferem em cada fase intra e entre participantes. Esses resultados indicam que os diferentes níveis de variabilidade obtidos não estavam sob controle exclusivo das variáveis manipuladas. A comparação das porcentagens de tentativas com composições diferentes entre as Fases QQ e VAR mostrou, no entanto, que há algumas diferenças entre os resultados obtidos nessas contingências. Para metade dos participantes (P2, P3, P4, P5, P9 e P11, quatro deles expostos primeiro a QQ e depois a VAR), maior variabilidade foi observada em VAR. Para um terço dos participantes (P7, P8, P10 e P12, todos expostos primeiro a VAR e depois a QQ), maior variabilidade foi observada em QQ. Para dois participantes (P1 e P6, expostos primeiro a QQ), não foi possível observar uma diferença clara entre as duas condições.

Observa-se que oito dos participantes (P2, P3, P4, P5, P7, P8, P10 e P12) variavam mais nas composições formadas durante a Fase 4, independentemente desta ser QQ ou VAR. Dois dos outros quatro participantes (P1 e P6) não apresentaram mudança na variabilidade entre as condições quando VAR foi apresentada após QQ e outros dois (P9 e P11) apresentaram menor variabilidade na Fase 4 quando esta foi QQ antecedida por VAR na Fase 2. Uma análise da história de cada participante no experimento não indicou efeitos sistemáticos de uma fase sobre a outra no que se refere à porcentagem de tentativas com composições diferentes.

Ao considerar-se o total de composições-alvo formadas, os dados mostram que os participantes formaram mais comumente entre 7 e 8 das oito composições sorteadas para cada fase, com exceção de P1 e P9, que formaram seis composições-alvo em T2 e em T1, respectivamente, e P11, que formou cinco composições-alvo em QQ. O alto número de composições-alvo formadas dificultou avaliar os efeitos das contingências manipuladas, observando-se um efeito de teto para pelo menos oito dos 12 participantes (P2, P4, P5, P6, P7, P10, P11 e P12) que formaram todas composições-alvo já na linha de base (T1). P6, P7 e P10 formaram todas composições-alvo em todas as fases.

Apesar disso, pode-se notar que o número de composições-alvo formadas tendeu a variar, ainda que não perfeitamente, junto com a porcentagem de tentativas com composições diferentes, de modo que quanto mais variadas as composições formadas, maior o número de composições-alvo. Tal relação não pode ser feita no caso dos participantes que formaram todas composições-alvo em todas as fases.

Além do número de composições alvo formadas, foi analisado o número de tentativas para formá-las. No Gráfico 2 estão apresentadas curvas de número acumulado de composições-alvo formadas pelos participantes P1 a P6, ao longo das tentativas. À esquerda encontram-se as curvas nas condições QQ (linha cinza) e VAR (linha preta) e à direita nos testes T1 (linha pontilhada), T2 (linha cinza) e T3 (linha preta). A porção final de cada curva indica a tentativa na qual o último problema foi resolvido.

Nota-se que todos os participantes expostos à ordem de fases QQ-VAR apresentaram curvas acumuladas de composições-alvo formadas mais aceleradas em VAR do que em QQ ao final das sessões comparadas, ou seja, formaram as oito sequências-alvo em menos tentativas nessa fase. Ainda se destaca que quatro deles (P1, P2, P4 e P6) apresentaram curvas mais aceleradas em VAR do que em QQ do começo ao fim da fase. No caso de P3, a curva em VAR tornou-se mais acelerada que a curva em QQ antes da 40ª tentativa; e, no caso de P5, a curva de QQ foi mais acelerada em apenas dois momentos pontuais das fases comparadas, aproximadamente nas primeiras 15 tentativas e depois nas tentativas 35 a 40. A comparação das curvas obtidas nos testes (coluna direita) não permite observar uma relação sistemática entre os testes, mostrando grande variabilidade entre participantes nos três testes.

Os resultados obtidos nas mesmas medidas com os participantes P7 a P12 - expostos à ordem inversa das fases (VAR-QQ) - encontram-se na Gráfico 3. Comparando-se as Fases QQ e VAR, pode-se observar que os resultados de P7, P8, P10 e P12 são inversos aos de P1 a P6, ou seja, as curvas mostram maior aceleração final em QQ do que em VAR para esses quatro participantes. Apesar dessa inversão, há exceções a serem mencionadas.

A primeira exceção é que dois dos participantes expostos à ordem de fases VAR-QQ apresentaram curvas mais aceleradas em VAR (P9 e P11). Da mesma maneira como ocorreu para P1, P2, P4 e P6, no caso de P9 isso ocorreu do início ao final da fase, mas no caso de P11, foi uma diferença observada apenas a partir da 90ª tentativa, aproximadamente. Destaca-se ainda que P11, na condição QQ, após formar a quinta composição-alvo não formou mais nenhuma, o que pode ser visto pelo platô na curva na maior parte da fase realizada.

A segunda exceção é que, de maneira semelhante ao que ocorreu com P3 e P5 expostos à ordem QQ-VAR, P7, P8, P10 e P12, expostos à ordem VAR-QQ não apresentaram curvas claramente distintas do início ao fim das fases. Todos tiveram curvas mais aceleradas em VAR em parte das tentativas, e somente ao longo de cada fase é que a diferença das curvas passou a favorecer QQ. Destaca-se ainda, pela diferença com os demais participantes, o padrão das curvas acumuladas obtidas com P10, bastante aceleradas quando comparadas às dos demais em todas as fases.

A comparação das três curvas obtidas em T1, T2 e T3 dos participantes P7 a P12 mostrou que, como ocorreu com os participantes P1 a P6, foi encontrada variabilidade entre eles, com resultados melhores, intermediários e piores nas três condições de teste quando se considera o total de composições-alvo e o número de tentativas necessárias para formá-las.

Apesar das inconsistências entre os desempenhos do mesmo participante nos diferentes testes e, algumas vezes, entre as condições QQ e VAR, foi encontrada uma relação entre o nível de variabilidade comportamental dos participantes e a eficácia na resolução de problemas em todas as fases experimentais. É apresentada uma síntese de tal análise na Tabela, na qual foram classificadas separadamente as porcentagens de tentativas com composições diferentes (ou seja, nível de variabilidade) e o número máximo de tentativas e composições-alvo formadas (ou seja, eficácia na resolução de problemas) de cada participante em cada fase experimental. A classificação foi feita dos maiores valores (1º) para os menores valores (5º) em cada medida. Por exemplo, P1 apresentou maior variabilidade e maior eficácia na resolução de problemas na Fase T3 e apresentou menor variabilidade e eficácia na resolução de problemas na Fase T2. Sempre que os valores em alguma das medidas foram idênticos em duas ou mais fases, o nome da primeira delas na sequência do experimento foi inserido com um sinal de igual (=). Quando os valores diferiram em menos que 1%, no caso da variabilidade, e quando as curvas acumuladas estiveram quase sobrepostas na sua porção final, foi inserida com um sinal semelhança (≈) a fase com o maior valor na variável analisada. Os sinais indicam = ou ≈ com a fase seguinte.

Considerando-se as hierarquias dispostas na Tabela, observa-se que para dois terços dos participantes (P2, P4, P5, P6, P9, P10, P11 e P12) a classificação das fases quanto aos valores obtidos de variabilidade corresponde à classificação dos valores obtidos na resolução de problemas, o que é indicado pelos nomes das fases iguais nas duas linhas de cada participante. São exceções algumas das comparações de P1 (QQ x VAR), P3 (T1 x T2 x T3) e P7 (T1 x VAR), que podem ser todas atribuídas à proximidade entre os valores em uma ou ambas as variáveis. A única exceção considerável é observada no caso de P8, para o qual T2 foi a fase com menor variabilidade comportamental e mesmo assim foi a segunda com maior eficácia na resolução de problemas. Desse modo, para 11 dos 12 participantes há uma correlação entre maior porcentagem de tentativas com composições diferentes (maior variabilidade) e mais composições-alvo formadas em menos tentativas (resolução de problemas).

Discussão

Os resultados obtidos não permitem afirmar se há ou não um efeito produzido pelo reforçamento do variar em respostas precorrentes emitidas durante a composição de figuras (VAR) ou pelo reforçamento de quaisquer composições formadas (QQ) sobre a formação de composições-alvo (solucionar problemas) sorteadas e sistematicamente substituídas após o seu primeiro reforçamento com maior pontuação do que a formação de composições não alvo.

Três fatores principais possivelmente interferiram nos resultados obtidos: um efeito de teto observado, dado que muitos participantes, já na linha de base, formaram todas as composições-alvo; um possível efeito de ordem, favorecendo os resultados obtidos na segunda condição apresentada ao se comparar VAR e QQ; e a ausência de controle do nível de variabilidade comportamental apresentado pelos participantes.

O efeito de teto observado poderá ser avaliado em estudos futuros, por exemplo, incrementando-se a dificuldade da tarefa pelo aumento do universo de composições possíveis ou selecionando-se participantes com baixo nível de variabilidade durante uma linha de base. No presente estudo, a análise do número de tentativas necessárias para se formar as composições-alvo com base nas curvas acumuladas constituiu uma estratégia viável para lidar com o limite encontrado, uma vez que essa medida não se mostrou prejudicada pelo efeito de teto. Ela permitiu mostrar que, apesar de frequentemente formarem todas as composições-alvo nas Fases VAR e QQ, o número de tentativas necessárias é menor em VAR e maior em QQ para mais participantes, ainda que possa existir um efeito de ordem.

O possível efeito de ordem foi suposto principalmente pela comparação das Fases 2 e 4, nas quais se vê mais composições-alvo formadas em menos tentativas na segunda, independente da condição apresentada nesta, para 10 dos 12 participantes. Apesar da plausível interferência da ordem, exceções foram identificadas para dois participantes expostos primeiro a VAR (P9 e P11), indicando que, para eles, os efeitos das contingências programadas e da ordem de exposição podem ter se mesclado. Um dado consistente que não revela um efeito de ordem, pelo menos nas condições em que há pouco reforçamento, é que não foi observada uma melhora progressiva ao longo das condições de teste, o que também precisa ser considerado antes de se atribuir os resultados obtidos à ordem das condições. Quais variáveis relacionadas à ordem de exposição às condições influenciaram os resultados precisa ser identificado e controlado. Levanta-se o acúmulo de treino ou de exposição à tarefa experimental ao longo do estudo, variável apresentada como relevante em estudos de resolução de problemas (Neves Filho, Carvalho Neto, Taytelbaum, Malheiros & Knaus, 2016); e o efeito da história prévia com as diferentes condições sobre o responder nas condições subsequentes, efeito já notificado por estudos de variabilidade comportamental (Caldeira, 2009).

Os dados de variabilidade comportamental obtidos em todas as fases (Figura) por vezes foram diferentes em uma mesma condição e semelhantes entre condições diferentes tanto em comparações intraparticipante quanto entre participantes. Isso pode estar relacionado tanto a variáveis estranhas não controladas como a características das condições apresentadas, que poderão ser investigadas isoladamente em estudos futuros. Uma dessas características é que as contingências em que não havia reforçamento para variar - testes e reforçamento de quaisquer composições formadas - não eram incompatíveis com a variabilidade. Os testes poderiam ser considerados como uma condição de extinção (pelo menos no que diz respeito às composições-alvo já reforçadas na própria fase, uma vez que a composição-alvo era reforçada apenas na primeira vez). Dado que as composições-alvo foram sistematicamente substituídas, pode ter ocorrido também o reforçamento intermitente do variar após muitas variações não reforçadas serem seguidas por uma reforçada. A extinção e a intermitência do reforçamento são indicadas na literatura como condições indutoras de variabilidade comportamental (Neuringer, 2015; Barba 2015, Galizio, Frye, Haynes, Friedel, Smith & Odum, 2018). O reforçamento de quaisquer composições formadas, por sua vez, pode ser descrito como um esquema concorrente em que formar composições-alvo era reforçado com mais pontos e formar qualquer outra composição, reforçado com menos pontos. Não se reforçava diretamente o variar as composições diferentes do alvo, mas o responder variado poderia ser reforçado.

Uma forma de controlar o efeito de variabilidade gerado pelas condições seria acoplar a condição QQ à condição VAR, tornando possível comparar o nível de variabilidade gerado em cada uma delas, sendo a exigência de variação a única diferença; essa estratégia metodológica foi adotada em estudos de variabilidade comportamental diretamente reforçada (Fialho, Micheletto & Sélios, 2015; Page & Neuringer, 1985).

O reforçamento do comportamento novo (pela contingência de reforçamento do formar composições-alvo) também poderia explicar o aumento da variabilidade comportamental (Goetz & Baer, 1973) que, no presente caso, foi praticamente indistinto entre as fases. O efeito desta variável sobre a variabilidade poderia ser isolado pela exposição às condições de testes, QQ e VAR na ausência de reforçamento por formar composições-alvo. Outra possibilidade seria reforçar, em todas as condições, uma composição-alvo específica concorrentemente ao reforçamento de outras composições. O papel do reforçamento concorrente da variabilidade comportamental sobre a seleção de respostas-alvo específicas tem sido estudado com sujeitos não humanos (Grunow & Neuringer, 2002; Neuringer, 1993) e humanos (Caldeira, 2009; Romano, 2014). Se forem obtidos resultados semelhantes aos desses estudos, isso pode sugerir uma continuidade entre situações problema nas quais não é exigido comportamento criativo e aquelas nas quais esse comportamento é exigido.

Dada a baixa porcentagem de tentativas com composições diferentes para a maioria dos participantes na maioria das fases (porcentagens entre 20% e 60%), a diferença nos resultados de P10, que variou muito nas composições formadas em cada fase, merece ser destacada. Uma inspeção visual da distribuição de composições formadas por P10 mostrou que, a partir da 7ª tentativa da Fase T1 e em praticamente todas as tentativas das fases subsequentes, ele apresentou um padrão de variação sistemática das respostas aos quatro estímulos de cada dimensão (forma, cor e localização). Esse padrão consistiu fundamentalmente na repetição da resposta em duas das dimensões (no caso, forma e localização) até que as respostas à terceira dimensão (cor) tivesse variado entre todas as quatro possibilidades. Uma possível implicação desse padrão de respostas seria formar mais rapidamente muitas das 64 possibilidades sem repetições e, assim, formar as composições-alvo com maior rapidez. A presença de padrões de variabilidade sistemática desse tipo ocorreu apenas pontualmente em algumas fases no caso de alguns dos demais participantes. Neuringer (2002) refere-se a um padrão de variação comportamental como este como uma "estratégia baseada em memória", padrão comum em estudos de variabilidade com humanos, e discute a possibilidade de que este seja produto de um controle de estímulos gerados pelo próprio responder passado.

Um aspecto a ser considerado, e que poderia estar envolvido no controle de estímulos pelo próprio responder, refere-se à presença dos diferentes estímulos de cada dimensão ao longo da tarefa, variável cujo efeito sobre a variabilidade não foi avaliado neste estudo. Diferentemente de outros estudos sobre o reforçamento direto da variabilidade comportamental, as escolhas dos participantes em cada dimensão de estímulo em uma tentativa produziam como consequência, além dos possíveis pontos, estímulos (por exemplo, cor azul) que podem ter exercido função discriminativa para as escolhas nas dimensões seguintes. No estudo de Schwartz (1980, Experimento 3) a presença de uma matriz luminosa com função similar de indicar aos sujeitos experimentais, nesse caso, pombos, teve como efeito a diminuição da variabilidade comportamental. Um efeito semelhante poderia ser suposto para os 11 participantes que apresentaram menores níveis de variabilidade, ao que P10 seria uma exceção. Apesar de esta ser uma interpretação plausível, ainda se discute na área se um controle discriminativo do próprio responder em tentativas passadas favoreceria ou dificultaria a variação no responder sob contingências de reforçamento da variabilidade (Doughty & Galizio, 2015).

Outra variável que não foi controlada, e que pode ter afetado o padrão de variação dos participantes, foi o possível controle por descrições verbais, acuradas ou não, formuladas por eles ao longo das sessões. Apesar de não terem sido controladas, essas respostas verbais ocorreram e foram por vezes relatadas ao experimentador (por exemplo: "já entendi como é", "não era o que eu estava pensando", "você vai ver que escolhi mais no azul", "nessa parte eu acertei todas, só dá para ganhar quarenta pontos"). Poder-se-ia supor que o controle por regras no caso de P10 poderia ter levado aos resultados discrepantes em relação aos demais participantes.

Outro aspecto que pode ser levantado com base nos resultados de P10 é que esse foi o participante que mais rapidamente resolveu todos os problemas em cada fase, mas, ao mesmo tempo, foi aquele com menor pontuação no estudo. O maior reforçamento por fase, para os participantes que resolveram os problemas com menor eficácia, talvez explique o padrão obtido com a maioria dos participantes e indica a necessidade de alteração na densidade de reforçamento para o comportamento de formar as composições-alvo, com o objetivo de superar esse desequilíbrio. Isso poderia ser feito ajustando-se as pontuações por composições formadas nas condições QQ e VAR e por se formar as composições-alvo, de modo a se avaliar os efeitos de: a) obtenção de mais pontos nas primeiras contingências do que na segunda (como ocorreu no presente estudo); b) obtenção de quantidades iguais de pontos nas duas contingências; e c) obtenção de mais pontos por se formar composições-alvo e menos pontos em QQ e VAR. No caso de P10, no entanto, o padrão de variação sistemática no responder foi selecionado na condição T1, na qual tal discrepância na pontuação não existia, e pode ter se mantido nas fases seguintes mesmo com a diferença de pontos obtidos.

Além das variáveis acima discutidas, outras características não mencionadas da tarefa experimental, como a posição dos estímulos na tela, o custo de resposta relativo à alternância entre esses estímulos e a apresentação de pontos nas Fases QQ e VAR no mesmo contador para composições-alvo e não alvo precisam ser avaliadas. Isso poderia ser feito: 1) garantindo-se uma disposição equidistante dos estímulos na tela, o que evitaria um maior custo de resposta para algumas alternações do que para outras, variável apontada por Caldeira (2009) e 2) usando-se de um contador para as contingências de Teste, QQ e VAR e outro contador separado para os pontos produzidos por formar composições-alvo, o que aumentaria a discriminabilidade entre as duas contingências concorrentes.

Outra característica a ser explorada em estudos futuros é o efeito da distribuição dos pontos utilizados como reforçadores para as três respostas de clicar com o mouse emitidas pelos participantes ao longo da tentativa. Poderiam ser comparados os efeitos desta forma de reforçar o variar com a apresentação do reforçador pela composição final formada após as três respostas do participante, como ocorreu na condição QQ.

Apesar de os resultados não evidenciarem um efeito do reforçamento do variar sobre a resolução de problemas, o presente estudo permitiu observar uma recorrente relação: maiores níveis de variabilidade acompanharam maior número de composições-alvo formadas em menos tentativas, e menores níveis de variabilidade acompanharam menor número de composições-alvo formadas em mais tentativas, o que ocorreu para 11 dos 12 participantes. Esse resultado atesta a importância de se continuar investigando o efeito do reforçamento da variabilidade sobre a resolução de problemas. Em estudos futuros, o controle dos níveis de variabilidade comportamental obtidos e a prevenção dos efeitos de teto e ordem aqui discutidos poderão permitir uma afirmação mais segura da relação de facilitação da resolução de problemas pelo aumento da variabilidade comportamental.

Tomados em conjunto, os resultados sugerem que maiores níveis de variabilidade favorecem, em participantes humanos, a resolução de problemas, aqui entendida como a emissão de respostas com um produto previamente determinado pelo experimentador e sempre desconhecido pelo participante. Em situações que envolvem a seleção de respostas-alvo específicas, e não novas, definidas pelo experimentador, os dados são condizentes com a afirmação de que o reforçamento da variabilidade facilita tal seleção. Diferentemente desses estudos, no caso do experimento presente, as composições-alvo sorteadas consideradas como respostas-solução foram sempre novas, no sentido de nunca terem sido reforçadas como resposta-solução antes e nunca serem reforçadas como resposta-solução novamente. Como defendido anteriormente, situações-problema dessa natureza, nas quais nem a resposta-solução, nem as consequências reforçadoras produzidas por resposta emitida são conhecidas, são análogas a problemas cotidianos nos quais é exigida criatividade, tais como pintar uma tela, escrever um texto literário ou compor uma música. Desse modo, a metodologia adotada pode constituir um ponto de partida para o estudo do comportamento criativo em situação controlada de laboratório, pelo menos em algumas de suas características.

Referências

Barba, L. S. (2015). Controlling and predicting unpredictable behavior. The Behavior Analyst, 38(1), 93-107. https://doi.org/10.1007/s40614-014-0019-9 [ Links ]

Caldeira, K. M. (2009). Variabilidade comportamental e a aquisição de respostas com baixa probabilidade de ocorrência (Dissertação de Mestrado). Pontifícia Universidade Católica de São Paulo, São Paulo, SP. Recuperado de https://sapientia.pucsp.br/bitstream/handle168616861/1/Karine%20Marques%20Caldeira.pdf [ Links ]

Neves Filho, H. B., Carvalho Neto, M. B., Taytelbaum, G. P. T., Malheiros, R. S., & Knaus, Y. C. L. (2016). Effects of different training histories upon manufacturing a tool to solve a problem: Insight in capuchin monkeys (Sapajus spp.). Animal Cognition, 19(6), 1151-1164. https://doi.org/10.1007/s10071-016-1022-1. [ Links ]

Doughty, A. H., Giorno, K. G., & Miller, H. L. (2013). Effects of reinforcer magnitude on reinforced behavioral variability. Journal of the Experimental Analysis of Behavior, 100(3), 355-369. https://doi.org/10.1002/jeab.50 [ Links ]

Doughty, A. H., & Galizio, A. (2015). Reinforced behavioral variability: Working towards an understanding of its behavioral mechanisms. Journal of the Experimental Analysis of Behavior, 104(3), 252-273. https://doi.org/10.1002/jeab.171 [ Links ]

Fialho, J. P. G., Micheletto, N., & Selios, T. L. (2015). Produção de variabilidade comportamental e sua extensão em crianças com autismo. Acta Comportamentalia, 23(4), 391-404. [ Links ]

Galizio, A., Freye, C. C. J., Haynes, J. M., Friedel, J. E., Smith, B. M., & Odum, A. L. (2018). Persistence and relapse of reinforcement behavioral variability. Journal of the Experimental Analysis of Behavior, 109(1), 210-237. https://doi.org/10.1002/jeab.309 [ Links ]

Goetz, E. M., & Baer, D. M. (1973). Social control of form diversity and the emergence of new forms in children's block building. Journal of Applied Behavior Analysis, 6(2), 209-217. https://doi.org/10.1901/jaba.1973.6-209 [ Links ]

Grunow, A., & Neuringer, A. (2002). Learning to vary and varying to learn. Psychonomic Bulletin & Review, 9(2), 250-258. https://doi.org/10.3758/BF03196279 [ Links ]

Guimarães, M. C., & Micheletto, N. (2017). Procedimento para ensino de mandos e variabilidade na topografia das respostas em crianças autistas. Estudos de Psicologia, 22(4), 366-377. https://doi.org/10.22491/1678-4669.20170038 [ Links ]

Neuringer, A. (1993). Reinforced variation and selection. Learning & Behavior, 21(2), 83-91. https://doi.org/10.3758/BF03213386 [ Links ]

Neuringer, A. (2015). Reinforced (un) predictability and the voluntary operant. European Journal of Behavior Analysis, 17(1), 19-30. https://doi.org/10.1080/15021149.2015.1084767 [ Links ]

Page, S., & Neuringer, A. (1985). Variability is an operant. Journal of Experimental Psychology: Animal Behavior Processes, 11(3), 429-452. https://doi.org/10.1037/0097-7403.11.3.429 [ Links ]

Romano, C. (2014). A produção de variabilidade em respostas intraverbais de crianças com autismo e a seleção de respostas novas (Tese de Doutorado). Pontifícia Universidade Católica de São Paulo, São Paulo, SP. Recuperado de https://sapientia.pucsp.br/bitstream/handle/16727/1/Claudia%20Romano.pdf [ Links ]

Schwartz, B. (1980). Development of complex, stereotyped behavior in pigeons. Journal of the Experimental Analysis of Behavior, 33(2), 153-166. https://doi.org/10.1901/jeab.1980.33-153 [ Links ]

Shahan, T. A., & Chase, P. N. (2002). Novelty, stimulus control, and operant variability. The Behavior Analyst, 25(2), 175-190. https://doi.org/10.1007/BF03392056 [ Links ]

Skinner, B. F. (1969). Contingencies of reinforcement: A theoretical analysis. New York, NY: Apleton-Century-Crofts. [ Links ]

Endereço para correspondência:
Emerson Ferreira da Costa Leite
efleite@pucsp.br

Nilza Micheletto
nmicheletto@pucsp.br

Submetido em: 10/07/2018
Revisto em: 06/03/2019
Aceito em: 11/04/2019