Serviços Personalizados
Journal
artigo
Indicadores
Compartilhar
Avaliação Psicológica
versão impressa ISSN 1677-0471versão On-line ISSN 2175-3431
Aval. psicol. v.1 n.2 Porto Alegre nov. 2002
ARTIGOS
Matrizes Progressivas do Raven Infantil: um estudo de validação para o Brasil
Raven's Colored Progressive Matrices for Children: a validation study for Brazil
Luiz Pasquali I; Solange Wechsler II; Edith Bensusan III
I Universidade de Brasília
II PUCCAMP
III Fundação Educacional do Distrito Federal
RESUMO
O artigo apresenta a validação do Raven Infantil para o Brasil, baseada numa amostra de 9.929 crianças do sistema educacional do Distrito Federal. A análise fatorial verificou a presença de 4 fatores no teste, sendo estes reconhecidos como raciocínio analógico-abstrato, raciocínio analógico-concreto, percepção da gestalt e raciocínio dedutivo. Destes, apenas o raciocínio analógico-abstrato, composto de 15 itens, se mostrou consistente. Ademais, os quatro fatores estão correlacionados, permitindo a extração de um fator geral, constituído por 25 dos 36 itens do teste original, o qual foi denominado de raciocínio analógico. O fator de raciocínio analógico-abstrato se mostrou bastante difícil para a maioria das crianças, apresentando um índice de dificuldade de b = 0,82, enquanto o fator geral se apresentou menos difícil, mas ainda acima da média geral de aptidão das crianças (b = 0,52). Conclui-se que o Raven Infantil é um teste adequado para avaliar o aspecto de raciocínio analógico de crianças brasileiras, mas uma série de itens se mostra, pelo menos, inútil no teste, sendo o item 24 totalmente inadequado.
Palavras-chave: Raven, Raven Infantil, Teste de inteligência.
ABSTRACT
The purpose of the research was to establish the validity of the Colored Progressive Matrices (CPM) for Brazil. Data were gathered from a sample of 9,929 students of the public educational system of Brasilia, Brazil. Factor analysis showed the presence of four factors, which were recognized as analogical-abstract reasoning, analogical-concrete reasoning, perception of the gestalt, and deductive reasoning. However, only deductive reasoning (15 items) appeared consistent. Furthermore, the four factors showed substantial covariance, which allowed for the extraction of a general factor, composed of 25 of the 36 items, identified as analogical reasoning. The deductive reasoning and the general factor appeared difficult for the children, presenting an index of b = 0.82 and b = 0.52, respectively. The conclusion was that the CPM are adequate for the assessment of analogical reasoning of Brazilian children, but several items of the original test appeared useless and item 24 was inadequate.
Keywords: Raven, Colored Progressive Matrices, Test of intelligence.
As Matrizes Progressivas do Raven Infantil (Colored Progressive Matrices - CPM) são uma das três formas deste teste de Raven, sendo as outras, as Matrizes Progressivas do Raven Geral (Standard Progressive Matrices - SPM) e as Avançadas (Advanced Progressive Matrices - APM). AS CPM constituem uma adaptação do Raven Geral para crianças, iniciada em 1947 e publicada, pela primeira vez, em 1949. As CPM são um subconjunto de 36 figuras do conjunto de 60 das Matrizes Progressivas do Raven Geral. Por isso, a teoria que fundamentou a construção destas é a mesma que baseia as CPM.
Embora não tivesse desenvolvido uma teoria detalhada para fundamentar suas Matrizes, Raven se orientou, na construção das mesmas, pelos princípios de três vertentes teóricas: a teoria dos dois fatores de Spearman (fator g), a teoria da Gestalt e a teoria do desenvolvimento cognitivo.
Raven foi especialmente influenciado pela es-cola inglesa da análise fatorial, a teoria dos dois fatores, criada por Spearman (1904a, 1904b, 1907, 1913, 1927, 1938) e seguida por grande número de estudiosos da época. A teoria se baseava em procedimentos estatísticos através dos quais Spearman demonstrava que as relações entre uma série de variáveis (as intercorrelações) podiam ser explicadas por um único grande fator, chamado de fator geral g. Spearman e outros pesquisadores verificaram que um número considerável de testes de habilidades humanas satisfazia este critério do fator geral.
Auxiliado pela sua experiência de professor e pelas pesquisas que empreendeu junto com o geneticista Lionel S. Penrose do Institute Colchester (Court, 1971) sobre a origem da deficiência mental, Raven identificou este fator como o fator noético, que consistia essencialmente na capacidade de fazer comparações, raciocinar por analogia e desenvolver um método lógico de pensar independentemente de informação previamente adquirida. Esta capacidade é por ele definida como "a apreensão da própria experiência, a edução de relações e edução de correlatos", isto é, fazer observações e extrair princípios (Cronbach, 1970). Esta habilidade se desenvolve linearmente com a maturação do organismo, portanto com a idade cronológica. Este desenvolvimento segue etapas numa evolução que poderíamos chamar a teoria do desenvolvimento cognitivo de Raven. O próprio Spearman considerou o teste de Raven a melhor prova não-verbal para avaliar o fator g ou a edução. Opinião esta compartilhada geralmente na Inglaterra na época, inclusive por Philip Vernon da Universidade de Calgary, Alberta (Savage, 1968).
Para melhor captar a originalidade genética deste fator geral e, assim, evitar influências de elementos culturais e de treinamento, Raven optou por itens de caráter gráfico em vez de verbal para o seu teste, seguindo, nesta elaboração, os princípios da teoria da Gestalt. Assim, todos os itens do teste foram projetados de forma que a solução dos mesmos ocorresse dentro da percepção, espacial ou lógica, de uma configuração (gestalt). A escolha das 36 figuras específicas finais para inclusão nas CPM seguiu dois tipos de critérios: critérios teóricos e critérios psicométricos. Quanto aos critérios teóricos, Raven considerou o seguinte: Cada uma das figuras do Raven Geral representa um problema, cuja solução implica que o respondente possua um certo nível de desenvolvimento intelectual. Assim, as figuras seriam escolhidas para as CPM se o problema que elas propunham apresentasse uma natureza tal que se adequasse à presença, na criança, da habilidade intelectual requerida para a solução do mesmo. Figuras que implicassem habilidades ainda não presentes no desenvolvimento da criança (de cinco a 12 anos) não poderiam entra nas CPM. Quais são estes níveis de desenvolvimento intelectual na criança?
Baseado em sua experiência e pesquisas sobre a deficiência intelectual e na teoria da Gestalt, Raven considerou que a criança dos cinco aos 12 anos de idade passa por cinco níveis de desenvolvimento cognitivo na solução de problemas. Assim, a criança é sucessivamente capaz de (1) distinguir figuras idênticas de figuras diferentes e distinguir figuras similares de figuras dissimilares; (2) avaliar a orientação da figura com relação à própria criança e a outros objetos no campo perceptual; (3) perceber duas ou mais figuras discretas como formando um todo ou uma entidade individual organizada; (4) analisar um todo em suas partes constituintes e distinguir entre o que aparece no real e o que ela própria acrescenta; e (5) comparar mudanças análogas nos constituintes percebidos e usar isto como um método lógico de raciocinar.
Quanto aos critérios psicométricos, Raven realizou uma análise estatística dos itens do Raven Geral, o que determinou a escolha das 36 figuras para comporem as CPM. A ordem foi re-arranjada para manter uma seqüência de dificuldade crescente dos itens e para evitar que a resposta correta, em figuras subsequentes, estivesse na mesma posição ou posições possivelmente privilegiadas.
A análise dos itens consistiu em verificar os índices de dificuldade e de discriminação. Curvas (ogivas), representando a percentagem de respostas corretas para cada item em função do escore total demonstravam se, com o aumento do escore total, aumentava também sistematicamente a percentagem de resposta correta do item. O item que mostrasse flutuações marcantes nesta relação de aumento em ambas as coordenadas (escore total e percentagem de acertos no item) era eliminado (Raven, 1956). Esta análise mantém uma semelhança perceptual com as análises modernas da Teoria de Resposta ao Item (TRI) que produzem as curvas características dos itens (ICC).
Destas análises resultou o teste com 36 itens, divididos em três séries de 12 itens cada (A, Ab, B), arrolados em dificuldade crescente dentro de cada série e entre as séries. Estes itens representam figuras nas quais falta uma parte que deve ser completada, utilizando um dos seis encaixes apresentados como alternativas de solução. Para completar corretamente a figura, o sujeito tem que solucionar o problema que a figura implica. O problema envolvido nas várias figuras varia de natureza, que pode implicar a percepção de diferença, similaridade, identidade, mudança, simetria, orientação e complementação da gestalt. Um problema pode representar uma figura contínua ou discreta. Toda a série A é composta de figuras contínuas, isto é, o problema consta de uma gestalt uniforme, um todo fisicamente unificado. Nas séries Ab e B, as figuras são discretas, isto é, o problema ou gestalt é composto de três partes, faltando uma para que surja um todo espacial ou logicamente uni-ficado. Este todo deve ser construído pelo observador, que unifica as partes espacialmente ou logicamente. O observador tem que descobrir o princípio que permite unificar coerentemente as partes para poder solucionar corretamente o problema.
Os princípios (natureza do problema) envolvidos na solução dos problemas vão desde a percepção de diferenças, similaridades e identidades na gestalt (como na série A) até a descoberta da necessidade de mudar a gestalt, adicionando ou subtraindo, por exemplo, elementos para completá-la corretamente (como na série B).
Segundo Raven (1956), a criança vai adquirindo a capacidade ou os princípios para solucionar os problemas através do desenvolvimento cognitivo, o qual depende fundamentalmente da idade cronológica, sendo que a experiência por si só em nada ajuda. O treinamento de problemas que exigem um nível de desenvolvimento X não ajuda a solucionar problemas que exigem um nível superior de desenvolvimento Y, porque só o avanço da idade (maturação) vai acrescentando ou instalando na criança estes princípios ou operações cognitivas.
Embora os estudos sobre a validade do Raven Geral sejam numerosos, concluindo pela boa qualidade do mesmo, a evidência em favor da valida-de das CPM já é menos abundante e menos convincente. Estudos de validade concorrente com testes de inteligência têm mostrado correlações moderadas (Birkmeyer, 1964), embora tal ocorrência não seja inesperada, dado que as CPM não pretendem ser uma medida de inteligência geral. De fato, as CPM têm melhores correlações com testes de raciocínio não-verbal. Por exemplo, com o teste de Informação do WISC a correlação é de 0,47 e com o Desenho de Blocos, de 0,74 (Martin & Wiechers, 1954).
As CPM não são um bom preditor acadêmico mas se apresentam bem como preditor de atividades exploratórias e independentes em classes que seguem uma metodologia de ensino flexível (Stanlings, 1975). Além disso, em situações especiais de ensino, como com crianças com deficiências intelectuais (Hausman, 1973) e ensino adaptativo (Wiedl, 1978), as CPM se apresentam mais eficazes que outros testes de inteligência para avaliar o potencial da criança.
Raven, dentro da teoria do fator geral que serviu de base para a construção das Matrizes Progressivas, não se propôs verificar a estrutura unifatorial postulada das CPM. Embora as cargas no fator geral sejam altas, como demonstraram inúmeros estudos posteriores, as CPM envolvem cargas expressivas em outros fatores, como já observaram alguns autores (Corman & Budoff, 1964; Carlson & Jensen, 1980). De um modo geral, a validade de construto das CPM precisa ser mais bem estabelecida.
Como as CPM têm sido utilizadas nas mais variadas partes do mundo, existem abundantes dados sobre o teste oriundos de culturas diferentes. Estes dados, embora indicando diferenças relevantes entre as várias culturas (Sinha, 1979; Kirby & Das, 1978), geralmente indicam a boa qualidade do teste.
Quanto à precisão das CPM, os dados disponíveis se baseiam principalmente nos estudos de Raven de 1952 a 1954 comparando crianças com distúrbios emocionais e crianças normais de 6,5 a 12,5 anos. A consistência interna tem-se mostrado alta nestes casos. Os dados de teste-reteste apresentados nos mesmos estudos mostraram índices de precisão de 0,90 no geral, sendo, porém, de 0,65 para crianças de menos de sete anos e de 0,80 para crianças maiores de nove anos. Uma série de estudos (Carlson & Jensen, 1980; Valencia, 1984) verificou que os índices de precisão (teste-reteste e das duas metades) se situam entre 0,80 e 0,90. Assim, Esquivel (1984) pôde concluir que as CPM são um teste válido e preciso, com grande utilidade de uso em culturas diferentes e especialmente útil com crianças possuidoras de deficiências sensoriais e problemas de comunicação oral.
As CPM não pretendem substituir os testes de inteligência. Elas visam avaliar apenas um aspecto da mesma, o raciocínio analógico, isto é, a habilidade de deduzir relações entre objetos ou elementos.
Em combinação com outros testes, contudo, as CPM são um instrumento valioso para avaliar a habilidade intelectual de pessoas analfabetas, de deficientes físicos (surdos, por exemplo) e de crianças com problemas especiais (Sigmon, 1983; Valencia, 1984).
Budoff e Corman (1976) e Feurstein (1979) utilizaram as CPM para avaliar e desenvolver estratégias de solução de problemas e outras estratégias cognitivas em crianças. O teste tem sido utilizado até com crianças cegas para discriminação tátil (Rich & Anderson, 1965) e avaliar pessoas com deficiências motoras e musculares.
A aplicação do teste é simples, não exigindo treinamento do aplicador. A compreensão da tarefa por parte da criança também não apresenta dificuldades maiores. É um teste de poder, não de rapidez, e por isso não tem limite de tempo, embora sua execução normalmente não passe de 20 minutos. A aplicação individual geralmente é necessária para crianças pequenas e também para deficientes que têm dificuldade para anotar as próprias respostas.
As CPM vêm sendo utilizadas amplamente no Brasil, sobretudo a partir da normatização feita por Angelini, Rosamilha e Almeida em 1966, com 505 crianças de sete a 11 anos, de São Paulo, Americana, Belo Horizonte e Rio de Janeiro. Em 1982, Jacquemin e Xavier apresentaram normas com 1131 crianças normais matriculadas na rede de ensino de Ribeirão Preto, São Paulo. Mais recentemente, Angelini, Alves, Custódio e Duarte (1987), com uma amostra representativa de 1417 crianças de cinco a 11,5 anos da cidade de São Paulo, dividi-das em 14 faixas etárias de seis meses, apresentaram normas percentílicas por idade.
Um estudo da validade e da precisão das CPM no Brasil foi efetuado por Angelini, Alves, Custódio, Duarte, e Duarte (1999) com uma amostra de 1547 sujeitos da cidade de São Paulo. Os autores fizeram uma análise detalhada dos itens através da Teoria de Resposta aos Itens1 . Ademais, avaliaram a precisão do teste através da técnica das duas metades, bem como a validade, utilizando a idade como critério. Entretanto, os mesmos autores não verificaram se os itens são unidimensionais, isto é, se o teste está de fato constituído por apenas um construto, fazendo fé, neste particular, na teoria que fundamentou a construção das Matrizes Progressivas Coloridas de Raven. Entretanto, esta hipótese deve ser verificada.
Como se observa, grande parte dos estudos sobre as CPM no Brasil se restringe à problemática da normatização. Por mais meritórios que estes estudos sejam, eles não abordam a problemática mais básica de um instrumento psicológico, que consiste em verificar a validade e a precisão do mesmo no novo contexto; no caso, o contexto brasileiro. Nestes mesmos estudos, toda a fundamentação da validade do instrumento se baseia em estudos feitos no exterior. Contudo, tais estudos feitos no exterior não podem fundamentar a qualidade do instrumento no contexto brasileiro. Além disso, a normatização evidentemente não garante a qualidade do instrumento. O presente trabalho visa examinar mais detalhadamente a questão da validade e da precisão das COM para o Brasil.
A adaptação do material das Matrizes Progressivas do Raven Infantil seguiu a tradução espanhola do teste (Bernstein, 1966), editado pela Editorial Paidós, Buenos Aires. Esta ocorrência se deveu a que a edição do mesmo teste pela Casa do Psicólogo, São Paulo, ainda não estava disponível, pois esta pesquisa iniciou em 1986 e a edição da Casa do Psicólogo é de 1987. A edição argentina tem de peculiar em relação à da Casa do Psicólogo a troca de ordem dos itens 11 e 12 da série A, troca que o presente estudo mostra ser acertada2.
O objetivo do presente estudo não foi o de verificar os parâmetros psicométricos do Raven Infantil em nosso meio. De fato, a teoria que fundamenta as CPM é a do fator único. Esta estrutura unifatorial das CPM já foi contestada por vários autores (Corman & Budoff, 1964; Carlson & Jensen, 1980) e parece importante dirimir esta questão que incide sobre a validade das CPM. Assim, o objetivo deste estudo consistiu em estabelecer a estrutura interna das CPM, bem como seus parâmetros de validade e precisão para o Brasil.
Método
Participantes
A amostra de cerca de 10 mil crianças de 5 a 11 anos de idade foi selecionada por faixa etária entre 64 escolas da rede pública de ensino do DF, abrangendo desde a pré-escola à quarta série do Primeiro Grau. Para a seleção da amostra, os Com-plexos Escolares do DF foram classificados em três regiões, de acordo com o nível sócio-econômico: Região 1: estrato sócio-econômico considerado alto, compreendendo escolas do Plano Piloto, Guará e Cruzeiro; Região 2: estrato sócio-econômico baixo, compreendia as escolas da Ceilândia e Gama; e Região 3: estrato sócio-econômico médio, compreendendo as escolas de Sobradinho, Planaltina, Taguatinga, Núcleo Bandeirante e Brazlândia.
O sorteio foi feito dentro de cada estrato de nível sócio-econômico, procurando-se ainda obter um número igual de crianças por sexo, na faixa etária de 6 em 6 meses, de 5 a 11 anos.
Baseados nos protocolos válidos, as dados da tabela 1 apresentam os detalhes da amostra de 9.929 crianças, onde se observa que há um número igual de sujeitos dos dois sexos, distribuídos mais ou me-nos eqüitativamente em termos de idade, dos 5 aos 11 anos, sendo a maioria (81,3%) nascida em Brasília. O nível sócio-econômico, em sua maioria, mostra ser uma amostra de classe baixa a média-baixa, com uma renda média mensal de até 5 salários mínimos, o que, aliás, é representativo da população brasileira. Observa-se igualmente que cerca de 50% dos pais (pai e mãe) dessas crianças não chegaram a completar o Primeiro Grau, embora haja cerca de 10% com curso universitário completo. A grande maioria das crianças (78.2% ou 87%, se desconta-dos os que não responderam esta questão) não é de repetentes, não havendo, portanto, apreciável defasagem entre idade e série escolar.
Procedimentos
Foram utilizados os cadernos do Teste Raven Escala Especial na versão da Editorial Paidós para todas as faixas etárias. O período de aplicação das provas foi de dois meses, no final de 1987. As instruções para aplicação seguiram criteriosamente o manual original, sendo esta feita individualmente ou em grupos de no máximo cinco sujeitos. A aplicação individual foi feita em crianças com até oito anos de idade e a coletiva em crianças a partir de oito anos de idade. Em cada um dos 16 Complexos Escolares da FEDF havia psicólogos responsáveis pela testagem das crianças, devidamente preparados para a realização da tarefa. Além disso, a parte do questionário relativa à entrevista com o aluno também foi de responsabilidade dos psicólogos. Os pedagogos e orientadores educacionais dos Complexos Escolares preencheram a ficha de identificação das crianças a partir dos arquivos da secretaria da escola e de entrevistas com os professores. Posteriormente, todos os testes e a ficha de identificação foram remetidos a uma equipe central que coordenava o projeto naquele momento. A digitação e crítica dos da-dos foram realizadas no Laboratório de Pesquisa em Avaliação e Medida - LABPAM, do Instituto de Psicologia da Universidade de Brasília.
Análises Estatísticas
Todas as análises estatísticas foram feitas com os escorres brutos (soma dos pontos ou acertos dos itens), uma vez que as normas existentes para as CPM no país não eram confiáveis e que esta própria pesquisa visava estabelecer normas de interpretação. Ademais, as análises estatísticas visavam estabelecer os parâmetros psicométricos do Raven Infantil e não produzir diagnósticos clínicos. Assim, foram realizados quatro tipos de análises estatísticas: (1) análise dos itens. Para esta análise foram efetuadas análises tradicionais e análises modernas da Teoria da Resposta ao Item, objetivando estabelecer os parâmetros de dificuldade e de discriminação dos itens do Raven Infantil. Foi utilizado o pacote MicroCat, especificamente o módulo ITEMAN para as análises tradicionais e o módulo ASCAL para as análises modernas. No caso destas últimas análises, foi seguido o modelo de três parâmetros (o modelo logístico de três parâmetros de Lord); (2) análise da estrutura interna do Raven Infantil. Para tanto, foi feita a análise fatorial dos eixos principais com rotação Oblimin. Após análises fatoriais exploratórias verificou-se que a estrutura cognitiva envolvida no Raven Infantil não aparecia organizada antes dos sete anos de idade. De fato, apenas um dos fatores, identificado depois como percepção espacial (ou da gestalt), aparecia estruturada em crianças menores de sete anos de idade. Esta descoberta sugeriu que a análise da estrutura do Raven Infantil deveria se basear em crianças de sete anos ou maiores. Para verificar a invariância da estrutura fatorial do teste, a análise foi feita em várias faixas etárias, dado que, pela teoria de Raven, a estrutura cognitiva envolvida no teste depende intrinsecamente da maturação orgânica. Para dar oportunidade de manifestação da rapidez do desenvolvimento maturacional, as faixas etárias foram separadas com um intervalo de 6 meses, obtendo-se, assim, 12 faixas de 6 meses (a partir de 5 anos e zero meses aos 11 anos e 0 mês). Além disso, para controlar variáveis de ordem cultural ou social, foram feitas análises fatoriais também por série escolar a fim de, novamente, determinar se a estrutura fatorial do Raven Infantil se mantinha invariante. Com o mesmo objetivo, estas análises foram ainda feitas por sexo, considerando que a maturação pode variar em função desta variável. Como todas estas análises, quando trabalhavam com crianças de 7 anos ou maiores, produziam resultados praticamente idênticos, serão apresentados, neste trabalho, apenas os dados obtidos com a amostra geral de crianças de 7 a 11 anos; (3) análise da consistência interna dos fatores. Esta foi estabelecida pela correlação item-fator para cada item, pelo alfa de Cronbach e pelo lambda de Guttman para os fatores.
Resultados
A estrutura interna do Raven infantil:
A composição fatorial do Raven infantil.
Logicamente dever-se-ia inicialmente efetuar uma análise dos itens para em seguida verificar a estrutura fatorial do teste. Acontece, porém, que a análise dos itens, tanto a tradicional quanto a da Teoria da Resposta ao Item, somente é adequada se estes forem unidimensionais, isto é, que pertençam ao mesmo fator. Por isso, a necessidade de efetuar antes uma análise fatorial do instrumento.
Uma análise preliminar dos componentes principais, com os dados de crianças de 7 anos ou maiores, mostrou que o Raven Infantil se compõe de seis fatores com eigenvalues superiores a 1,00, tendo quatro deles eigenvalues superiores a 1,40. Decidiu-se, então, fazer uma análise fatorial dos eixos principais com rotação Oblimin e com quatro fatores. Os resultados estão expressos na tabela 2, que apresenta a matriz fatorial pattern com as cargas iguais ou superiores a 0,28.
Esta análise mostrou a presença clara de quatro fatores. Como eles estavam correlacionados (r12 = 0,41; r13 = 0,12; r14 = -0,50; r23 = 0,31; r24 = 0,02; r34 = 0,09) e, inclusive para testar a hipótese de que as CPM mediam um único fator, foi feita uma análise fatorial confirmatória de um fator, cujos resultados estão também na tabela 3 sob a égide de fator geral. Nesta análise foram excluídos, além do item 24, também os itens 1 a 4 do fator 3.
Fica claro com os resultados da tabela 2 que o Raven Infantil mede quatro fatores, mas, em segunda ordem, mede também um fator único. Acontece, porém, que o fator 1 sozinho explica mais variância do Raven infantil que o próprio fator geral. Além disso, a análise da consistência interna dos fatores (alfa de Cronbach) mostra uma certa consistência em todos eles, apesar do número reduzido de itens de alguns deles. Entretanto, somente o fator 1 e o fator geral demonstram uma consistência interna definitivamente aceitável, isto é, acima de 0,80.
Estas análises já mostram a presença de al-guns itens inconsistentes e outros irrelevantes. Por exemplo, o item 24 se comporta de uma maneira bastante estranha. Primeiramente, ele não possui carga substancial em nenhum fator e, ademais, no fator 4 ele tem carga oposta aos demais itens do fator. Uma série de outros itens se apresenta bastante irrelevante, pois, se tomarmos como critério uma carga fatorial mínima de 0,30, isto é, uma comunalidade de apenas 10% (0,302 = 9%) entre o item e o fator, tais itens não contribuem substancialmente para a composição do fator ou, em outras palavras, eles não constituem uma boa representação do traço latente que o fator mede. Mesmo assim, se salvam o fator 1 e o fator geral como boa medida dos traços que representam.
Uma interpretação dos fatores deverá tornar mais clara a estrutura interna do Raven Infantil. Esta interpretação é feita em termos do conteúdo dos itens que compõem cada fator.
Fator 3: Este fator é composto pelos cinco itens mais simples das CPM, isto é, os cinco primeiros itens da série A. Todos eles implicam, como problema, a complementação de uma configuração simples e contínua, exigindo da criança apenas a capacidade de perceber diferenças ou similaridades em uma gestalt. A tarefa realmente se reduz ao preenchimento de uma lacuna simples. Requer da criança tão somente ser capaz de perceber uma gestalt completa preenchendo uma lacuna com ele-mentos já previstos na própria gestalt. O fator pode ser denominado de Percepção da Gestalt ou Habilidade Viso-espacial. Aliás, este fator não se relaciona nem com o fator 1 e nem com o 4.
Fator 2: É composto pelos itens mais simples das séries Ab, o item fácil da série B (item 26) e pelos itens 5 e 6 da série A. Trata-se novamente de complementação de uma configuração, mas a partir de uma gestalt percebida como discreta, isto é, formada por elementos individualizáveis. Na verdade, com exceção dos itens 5 e 6 (série A), que são uma gestalt contínua, os outros cinco itens têm como problema a apreensão de três figuras discretas formando uma totalidade unificada espacialmente com o preenchimento de uma quarta figura. Esta quarta figura ou elemento da gestalt geral constitui simplesmente a reprodução de uma das três outras figuras apresentadas na gestalt estímulo.
Diferentemente do fator 3, onde se trata apenas de percepção visual, o fator 2 exige da criança um pouco mais de compreensão que consiste em descobrir uma parte de um todo que se associe corretamente às outras partes para formar este todo. A criança tem que estabelecer uma relação entre as três partes apresentadas para, por analogia, descobrir a quarta parte faltante do todo. Como, entretanto, a parte faltante é uma das três apresentadas no todo, a tarefa não exige capacidade de maior abstração. Assim, este fator estaria se referindo ao que poderíamos chamar de Raciocínio Analógico-Concreto.
Fator 1: Formado pelos itens mais difíceis da série A e pelos itens de dificuldade intermédia das outras duas séries das CPM, o fator 1 apresenta como problema a complementação de uma gestalt em que a solução exige: (a) capacidade de ver mudanças pequeninas numa configuração contínua (série A) ou (b) capacidade de perceber simetria ou assimetria e mudanças entre as partes componentes de um todo (série Ab e B). Contrariamente ao fator 2, os elementos de solução do problema dos itens deste fator não constam diretamente (isto é, não são perceptíveis visualmente) na gestalt, mas são induzidos seguindo o movimento das partes apresentadas na gestalt. O problema exige, portanto, da criança, uma capacidade de raciocínio por analogia, mas já ao nível abstrato, dado que o elemento de solução não está presente visualmente na gestalt estímulo. É este aspecto abstrativo que torna este fator diferente do fator 2. Assim, o fator 1 cobre o conceito de Raciocínio Analógico-Abstrato.
Fator 4: Este fator é composto pelos cinco itens mais difíceis das CPM (os últimos da série B). O problema envolvido nesses itens comporta na apreensão de figuras relacionadas logicamente, cuja solução implica a capacidade de produzir mudanças nas mesmas para se constituir uma gestalt logicamente unificada. Implica, portanto, em geral, subtrair ou adicionar elementos nas figuras estímulos para produzir a quarta figura que coerentemente continua as outras três para se obter a gestalt final unificada. As tarefas na solução destes itens já exigem da criança capacidade de abstração e dedução. O fator cobriria o conceito de Raciocínio Dedutivo ou de Abstração Reflexiva.
Fator Geral: O fator geral ou de segunda ordem do Raven Infantil é composto pelos itens dos fatores primários 1, 2 e 4. Isto é, ele representa o raciocínio analógico, contendo tanto os componentes concretos quanto os abstratos (raciocínio analógico-concreto e raciocínio analógico-abstrato), bem como os componentes do raciocínio dedutivo. Não compõem este fator geral os componentes do fator 2, a saber, os elementos da percepção da gestalt, ainda que estes sejam pressupostas necessários para que possa se manifestar o raciocínio. Este fator pode, então, ser chamado simples-mente de Raciocínio Analógico.
Análise dos Itens do Raven Infantil
Considerando que, pelo menos ao nível de segunda ordem, o Raven Infantil é um instrumento unifatorial, é legítimo se proceder a uma análise global dos 36 itens do mesmo. Esta análise foi feita nos moldes tradicionais e também no contexto da Teoria da Resposta ao Item e os resultados estão especificados na tabela 3. Como algumas destas análises exigem dados completos, muitos protocolos ficaram excluídos por estarem incompletos, reduzindo a amostra de crianças. Contudo, esta amostra nunca foi menor do que 9.350 crianças.
A tabela 3 apresenta a análise da dificuldade e da discriminação dos itens pelo sistema tradicional (colunas PC e PBs) e pelo modelo da Teoria da Resposta ao Item (TRI). A análise tradicional avalia a dificuldade dos itens em termos da percentagem de acertos e a discriminação em termos da correlação ponto-bisserial. A TRI faz as mesmas análises via modelo logístico, utilizando o modelo de três parâmetros de Lord, onde o a representa o índice de discriminação, o b o de dificuldade e o c o parâmetro da resposta certa dado ao acaso, analisando igualmente a adequação dos dados ao modelo proposto (Resíduo). A escala dos a vai de 0 (nada discriminativo) até cerca de 4 (100% discriminativo) e a dos b de -3 (item facílimo) a +3 (item de dificuldade extrema), passando por 0 (dificuldade média), sendo o chute expresso pela percentagem. Note que o b é expresso em termos de escores z que podem, teoricamente, ir de -¥ a +¥, mas que na prática não passa de -3 a +3, já que nesta faixa caem mais de 99% dos casos.
Avaliando os dados da Tabela 3, alguns pontos podem ser realçados: primeiramente, a ordenação dos itens do Raven Infantil em termos de dificuldade crescente está razoavelmente satisfeita, ainda que não perfeita (veja a coluna dos b e dos PC). Também o índice de discriminação dos itens é de muita boa (em torno de 1,00) a excelente (ultrapassando 2,00). Apenas o item 8 apresenta índice de discriminação fraco. O item 24 foi eliminado da análise por razões explicadas acima (aliás, incluso na análise, este item deu um índice estranho de -0,05 no parâmetro PBt, que fala da validade do item).
Com estes reparos, a análise dos itens mostra que o Raven Infantil contém itens com boas qualidades psicométricas, pois a maioria deles apresenta a dita validade do item, isto é, eles são uma boa representação do construto a que se referem, o que é expresso pela carga fatorial deles no respectivo fator. Além disso, sabendo que o índice de discriminação indica que o item é capaz de diferenciar sujeitos com níveis próximos de aptidão, todos os itens do Raven Infantil, com exceção do item 24, são capazes de tal proeza.
Embora o Raven Infantil apresente itens com bons parâmetros psicométricos, é preciso avaliar se ele possui igualmente bons parâmetros psicométricos como instrumento de medida. Isto importa em analisar os vários fatores que ele pretende medir, a saber, os quatro fatores primários e o fator geral (de segunda ordem). Então vejamos.
O Raven Infantil pretende ser um instrumento de medida de construtos, isto é, de traços latentes, mais especificamente do raciocínio analógico. A fim de se apresentar como um instrumento adequado para realizar esta tarefa, o Raven Infantil deve mostrar que é válido, que é preciso e que cobre equilibradamente toda a amplitude do construto raciocínio analógico ou dos construtos que pretende medir.
Validade do Raven Infantil
As análises fatoriais mostraram que o Raven Infantil cobre quatro construtos diferentes mas relacionados. No caso do fator 1, dos 16 itens relevantes a ele, 12 se apresentam com boas cargas fatoriais (acima de 0,40) e 4 com cargas iguais ou superiores a 0,30, o que indica que o construto definido por este fator possui uma boa representação comportamental, já que possui itens com boas cargas e em número suficiente. Caso similar pode ser feito para o fator geral, que, dos 25 itens, 19 apresentam cargas fatoriais muito boas e os demais, cargas razoáveis. O mesmo não se pode dizer dos demais três fatores, porque, embora apresentem alguns itens com boas a excelentes cargas fatoriais (portanto, constituindo uma boa representação comportamental do construto), eles são em número reduzido demais para poderem dar conta de representar toda a amplitude do respectivo traço latente.
Precisão do Raven Infantil
A análise da fidedignidade dos fatores do Raven Infantil, através do alfa de Cronbach, mostra que apenas o fator 1 e o fator geral apresentam índices satisfatórios, isto é, iguais ou superiores a 0,80. Os outros três fatores não apresentam índices aceitáveis, sobretudo devido ao número reduzido de itens que os compõem e, conseqüentemente, não podem ser considerados instrumentos confiáveis para a medida do respectivo construto.
Cobertura dos Construtos pelo Raven Infantil
Um instrumento para ser uma boa medida de um construto, além de representá-lo adequadamente, isto é, possuir itens com altas cargas fatoriais, deve cobrir toda a extensão de magnitude do construto e de uma forma eqüitativa. Em se tratando de instrumentos de aptidão, como é o caso do Raven Infantil, um bom instrumento de medida deve ter itens desde facílimos até dificílimos, bem como de dificuldade média. De fato, ele deve apresentar itens que cubram todos os níveis de magnitude do traço latente que mede e em número proporcional em cada faixa de dificuldade, isto é, deve haver mais itens de dificuldade média que itens facílimos ou dificílimos. Na verdade a distribuição dos itens no instrumento deve seguir mais ou menos a própria distribuição dos níveis da aptidão na população, a qual tipicamente se distribui segundo a curva normal. Assim, um bom instrumento terá seus itens distribuídos, em termos de dificuldade, conforme a figura 1, na qual a curva normal é divida em cinco faixas de dificuldade com a respectiva percentagem ideal de itens em cada faixa.
Como é que o Raven Infantil se sai na tarefa de representar toda a amplitude conceitual do construto que representa? A tabela 4 dá os subsídios para responder a esta pergunta.
A tabela 4 mostra claramente que apenas o fator 1 e, em especial, o fator geral, satisfazem a contento o critério de um instrumento cobrir eqüitativamente as faixas de amplitude do construto. Os demais fatores, embora possuam itens com parâmetros psicométricos aceitáveis e até excelentes, como instrumentos de medida não são aceitáveis, porque eles apenas são úteis para medir certos níveis do construto que pretendem medir. Assim, por exemplo, o fator 3 (percepção da gestalt) mede unicamente os níveis mínimos destas habilidades, enquanto o fator 4 mede exclusivamente os níveis máximos da aptidão (dedução) que pretende medir.
Assim, fica claro que o Raven Infantil, como instrumento de medida adequado, pode ser utilizado para avaliar o fator 1 (raciocínio analógico-abstrato), composto de 16 itens e para avaliar crianças com níveis elevados no fator, e o fator geral (raciocínio analógico), composto de 25 itens. Daqui para frente serão considerados, como perfazendo o Raven Infantil, somente estes dois fatores.
A figura 2 mostra a curva de informação que o fator 1 traz com respeito ao raciocínio analógico abstrato das crianças. A informação média do fator é de 3,69 pontos, indicados na figura pela linha pontilhada horizontal. Os dados indicam que este fator produz informação confiável para crianças que se situam na faixa de -0,10 até +2,10 escores z, isto é, para crianças que se situam entre os percentis 46 e 98. Portanto o fator se apresenta, em média, bastante difícil para as crianças brasileiras, pois, em relação à dificuldade média do teste, a média da aptidão destas crianças se situa a -0,82 escores padrões abaixo da média de dificuldade dos itens, o que implica em dizer que o teste supera a aptidão de cerca de 80% das crianças. O que condiz com os dados da tabela 4, onde verificamos que este fator não possui itens muito fáceis (0 itens nas faixas I e II de dificuldade) e um número proporcionalmente demasiado de itens nas faixas difíceis (faixas IV e V). De fato estas duas últimas faixas de dificuldade apresentam 75% dos itens do fator, quando deveriam somar a apenas 30%. De qualquer forma, embora difícil, este fator se apresenta adequado para avaliar a capacidade de raciocínio analógico-abstrato de crianças de 5 a 11 anos de idade.
Na Tabela 5 é apresentado um sumário das estatísticas e dos parâmetros psicométricos do fator 1, os quais permitem alguns comentários ulteriores sobre o fator.
Os dados da figura 2 e do quadro de sumários mostram que a média geral das crianças neste fator foi de cerca de 6,5 numa escala que vai de 0 a 16 (o escore bruto no fator consiste na soma dos acertos dos 16 itens); novamente se mostra o fator como sendo bastante difícil para a maioria das crianças, pois a média geral delas se situa abaixo (-0,82z) da dificuldade média dos itens. A média das 30% crianças com os escores mais baixos obtiveram um escore máximo de 3, enquanto o escore mínimo para as 30% crianças com os escores mais altos foi de 9. Por isso a distribuição dos escores das crianças apresenta um índice relativamente alto de assimetria (0,603) com uma longa cauda à direita (assimetria positiva). A curva característica média dos itens novamente mostra que o teste é em geral difícil para as crianças, como mostra a figura 2 (veja o parâmetro b)
Assim, a conclusão sobre a qualidade do fator 1 do Raven Infantil como instrumento de medida é a de que ele mede adequadamente a aptidão do raciocínio analógico-abstrato em crianças de 5 a 11 anos de idade, mas é composto por tarefas que apresentam bastante dificuldade para a maioria destas crianças.
A história contada sobre o fator 1 se repete quase idêntica no fator geral, sendo que ela é ligeiramente menos acentuada neste fator, isto é, a dificuldade relativa do fator geral para as crianças brasileiras de 5 a 11 anos de idade é apenas ligeiramente menos acentuada do que a dificuldade do fator 1. Tal ocorrência não estranha, dado que o fator geral é principalmente composto pelos itens do fator 1, além dos itens do fator 2 (raciocínio analógico-concreto) e fator 4 (dedução), sendo, porém, os itens do fator 1 os mais característicos. Com a entrada dos itens do fator 4, o fator geral se tornou mais difícil, mas com a entrada dos itens do fator 2, ele ficou mais fácil, resultando, no geral, que ele ficou praticamente com o nível de dificuldade do fator 1.
De fato, a figura 4, que mostra a curva de informação que o fator geral traz com respeito ao raciocínio analógico abstrato das crianças, indica que este fator se apresenta, em média, bastante difícil para as crianças brasileiras, pois, em relação à dificuldade média do teste, a aptidão média das crianças se situa a - 0,52 escores padrões abaixo da média de dificuldade dos itens, o que implica em dizer que o teste supera a aptidão de cerca de 70% das crianças. O que condiz com os dados da tabela 4, onde verificamos que este fator, embora possua itens fáceis em número adequado (itens nas faixas I e II de dificuldade), apresenta um número exagerado de itens muito difíceis (itens nas faixas IV e V). Na verdade, a última faixa de dificuldade apresenta 28% dos itens do fator, quando deveria apresentar apenas 10%. Assim, o fator geral do Raven Infantil é especialmente adequado para avaliar crianças que se situam na faixa de aptidão de - 0,20 a 2,50 escores padrões, isto é, entre o percentil 42 e 99. De qualquer forma, embora um pouco difícil, este fator se apresenta adequado para avaliar a capa-cidade de raciocínio analógico de crianças de 5 a 11 anos de idade.
A Tabela 6 apresenta um sumário das estatísticas e dos parâmetros psicométricos do fator geral, os quais permitem alguns comentários ulteriores sobre o fator.
Os dados da figura 5 e dos sumários mostram que a média geral das crianças neste fator foi de 11,2 numa escala que vai de 0 a 25 (o escore bruto no fator consiste na soma dos acertos dos 25 itens); novamente se mostra o fator como sendo bastante difícil para a maioria das crianças brasileiras, pois a média geral delas se situa abaixo (-0,52) da dificuldade média dos itens. A média das 30% crianças com os escores mais baixos obtiveram um escore máximo de 7, enquanto o escore mínimo para as 30% crianças com os escores mais altos foi de 14. Por isso, a distribuição dos escores das crianças apresenta um índice moderado tanto de assimetria (0,532) com uma longa cauda à direita (assimetria positiva). A curva característica média dos itens novamente mostra que o teste é em geral difícil para as crianças, como mostra a figura 5, pois a parâmetro b se situa acima de 0, mais ou menos a 0,5.
Assim, a conclusão sobre a qualidade do fator geral do Raven Infantil como instrumento de medida é a de que ele mede adequadamente a aptidão do raciocínio analógico em crianças de 5 a 11 anos de idade, mas é composto por tarefas que apresentam alguma dificuldade para a maioria destas crianças.
Referências
Angelini, A.L., Rosamilha, N. & Almeida, R.M. (1966). Normas brasileiras do Teste de Matrizes Progressivas. Ciência e Cultura, 18, 113-114. [ Links ]
Angelini, A.L., Alves, I.C.B., Custódio, E.M., Duarte, W.F., & Duarte, J.L.M. (1999). Matrizes progressivas coloridas de Raven. Manual. São Paulo, SP: Centro Editor de Testes e Pesquisas em Psicologia. [ Links ]
ASC (1996). User's manual for the ASC item and test analysis package. St. Paul, MN: Assessment Systems Corporation. [ Links ]
Bernstein, J. (1966). Test de Matrices Progresivas para la medida de la capacidad intelectual. Escala especial (Series A, Ab, B), Buenos Aires: Editorial Paidós. [ Links ]
Birkmeyer, F. (1964). The relationship between the Coloured Progressive Matrices and individual intelligence tests. Psychology in the Schools, 1, 309-312. [ Links ]
Budoff, M. & Corman, L. (1976). Effectiveness of a learning potential procedure in improving problem-solving skills of retarded and non-retarded children. American Journal of Mental Deficiency, 81, 160-164. [ Links ]
Carlson, J.S. & Jensen, M. (1980). Reliability of the Raven Coloured Progressive Matrices Test: Age and ethnic group comparisons. Journal of Consulting and Clinical Psychology, 49, 320-322. [ Links ]
Casa do Psicólogo (1987). Matrizes Progressivas Colori-das. Séries A, Ab, B. Escala especial. São Paulo: Casa do Psicólogo. [ Links ]
Corman, L. & Budoff, M. (1974). Factor structure of retarded and nonretarded children on Raven's Progressive Matrices. Educational and Psychological Measurement, 34, 407-412. [ Links ]
Court, J.H. (1971). John C. Raven, M.Sc., F.B. Ps.S. (1902-1970). British Psychological Society Bulletin, 24(82), 47-48. [ Links ]
Court, J.H. (1972, 1974, 1976, 1980, 1982). Researchers' bibliography for Raven's Progressive Matrices and Hill Hill Vocaculary Scales (eds. and supplements). Adelaide, South Australia: Flinders, University. [ Links ]
Cronbach, J.C. (1970). Essentials of psychological testing. 3d. ed. New York: Harper & Row Publs. [ Links ]
De, B. & Kala, C. (1971). Development of local norms for the Coloured Progressive Matrices. Journal of Vocational & Educational Guidance, 14(1), 1-10. [ Links ]
Esquivel, G.B. (1984). Coloured Progressive Matrices. In D.J. Keyser & R.C. Sweetland (Eds.), Tests Critiques, vol. I, 206-213. Kansas City, MI: Test Corporation of America. [ Links ]
Feurstein, R. (11979). The dynamic assessment of retarded performers: The learning potential assessment device, theory, instruments, and techniques. Baltimore: Univesity Park Press. [ Links ]
Hausman, R.M. (1973). Efficacy of three learning potential assessment procedures with Mexican-American educable mentally retarded children. Dissertation Abstracts, 33(7-A), 3438. [ Links ]
Jacquemin, A. & Xavier, M.A. (1982). O Teste das Matrizes Progressivas de Raven - Escala Especial. Estudo normativo em crianças de 5 a 11 anos. Ciência e Cultura, 34(4), 524-529. [ Links ]
Kirby, J. & Das, J.P. (1978). Information processing and human abilities. Journal of Educational Psychology, 70, 56-66. [ Links ]
Martin, A.W. & Wiechers, J.E. (1954). Raven's Progressive Matrices and the Wechsler Intelligence Scale for Children. Journal of Consulting Psychology, 18(2), 143-144. [ Links ]
Raven, J.C. (1956). Guide to using the Coloured Progressive Matrices. Sets A, Ab, B. Dumfries: The Crichton Royal. [ Links ]
Raven, J.C., Court, J.H., & Raven, J. (1984). Manual for Raven's Progressive Matrices and Vocabulary Scales, Section 2, Coloured Progressive Matrices (1984 edition). London: H. K. Lewis & Co., Ltd. [ Links ]
Rich, C.C. & Anderson, R.P. (1965). A tactual form of the Progresssive Matrices for use with blind children. Personnel and Guidance Journal, 43(9), 912-919. [ Links ]
Savage, R.D. (1968). Psychometric assessment of the individual child. Middlesex, England: Penguin Books, Inc. [ Links ]
Sigmon, S.B. (1983). Performance of American school-children on Raven's Coloured Progressive Matrices Scale. Perceptual and Motor Skills, 56, 484-486. [ Links ]
Sigmon, S.B., (1984). Notes on a relationship between Piagetian childhood thought development and Raven's Coloured Progressive Matrices. Perceptual and Motor Skills, 58(2), 436-438. [ Links ]
Sinha, D. (1979). Cognitive and psychomotor skills in India. Journal of Cross Cultural Psychology, 10, 325-355. [ Links ]
Spearman, C. (1904a). The proof and measurement of association between two things. American Journal of Psychology, 15, 72-101. [ Links ]
Spearman, C. (1904b). 'General intelligence' objectively determined and measured. American Journal of Psychology, 15, 201-293. [ Links ]
Spearman, C. (1907). Demonstration of formulae for true measurement of correlation. American Journal of Psychology, 18, 161-169. [ Links ]
Spearman, C. (1913). Correlations of sums and differences. British Journal of Psychology, 5, 417-426. [ Links ]
Spearman, C. (1927). The abilities of man. New York: MacMillan. [ Links ]
Spearman, C. (1938). Measurement of intelligence. Scientia, 64, 75-82. [ Links ]
Stallings, J. (1975). Implementation and child effects of teaching practices in follow through classroom. Monographs of the Society for Research in Child Development, 1-33. [ Links ]
Valencia, R.R. (1984). Reliability of the Raven Coloured Progressive Matrices for Anglo and for Mexican-American children. Psychology in the Schools, 21, 49-52. [ Links ]
Wiedl, K.H. (1978). Ecological aspects of differential predictive validity. Psychologie in Erziehung und Unterricht, 25, 369-371. [ Links ]
Endereço para correspondência
Instituto de Psicologia
Departamento de Psicologia Social e do Trabalho
Laboratório em Avaliação e Medidas - UnB.
E-mail: labpam@unb.br
Recebido: 03/12/2001
Aceito: 10/06/2002
1 O modelo utilizado parece ter sido o de 3-parâmetros de Lord, embora os autores digam que foi o Rasch; mas este é o modelo de 1-parâmetro.
2 Fica, contudo, o alerta que a numeração destes dois itens segue a edição argentina, isto é, em relação ao teste comercializado no Brasil, o 11 é o 12 e vice-versa.