Validação brasileira do teste não-verbal de inteligência SON-R 2½-7[a]

Laros, Jacob Arie; Jesus, Girlene Ribeiro de; Karino, Camila Akemi

Serviços Personalizados

Journal

artigo

Tradução automática

Indicadores

Acessos

Mais
Mais

Permalink

Avaliação Psicológica

versão impressa ISSN 1677-0471

Aval. psicol. vol.12 no.2 Itatiba ago. 2013

Validação brasileira do teste não-verbal de inteligência SON-R 2½-7[a]^1,2

Brazilian validation of the nonverbal intelligence test SON-R 2½-7[a]

Validación brasileña de la prueba no verbal de inteligencia SON-R 2½-7[a]

Jacob Arie Laros³; Girlene Ribeiro de Jesus; Camila Akemi Karino

Universidade de Brasília

RESUMO

Este artigo apresenta estudos realizados no Brasil referentes à evidência de validade de construto do teste SON-R 2½-7[a], versão abreviada do SON-R 2½-7, que possui estudos de normatização e validação realizados em vários países europeus. O SON-R 2½-7[a] é um instrumento não-verbal que avalia amplas áreas de inteligência para crianças entre 2½ e 7 anos. Os dados da amostra nacional de normatização brasileira com 1.200 crianças foram analisados utilizando tanto análise fatorial exploratória como análise fatorial confirmatória. Os resultados apóiam a distinção adotada no teste entre a escala de execução e a escala de raciocínio. Os resultados indicam uma boa validade de construto do SON-R 2½-7[a] e sugerem que o teste é uma ferramenta promissora para a avaliação das habilidades cognitivas de crianças no Brasil.

Palavras-chave: teste não-verbal de inteligência; validade de construto; SON-R 2½-7[a].

ABSTRACT

This article presents studies realized in Brazil related to evidence of the construct validity of the SON-R 2½-7[a], the abridged edition of the SON-R 2½-7, a nonverbal test with normatization and validation studies realized in various European countries. The SON-R 2½-7[a] measures broad areas of intelligence for children between 2½ and 7 years of age. Data of a national sample of 1,200 children of the normatization study in Brazil were analyzed, using both exploratory and confirmatory factor analysis. The results support the distinction adopted in the test between a performance and a reasoning scale. The findings indicate a good construct validity of the SON-R 2½-7[a] and suggest that it is a promising tool for the evaluation of cognitive abilities of young children in Brazil.

Keywords: nonverbal test of intelligence; construct validity; SON-R 2½-7[a].

RESUMEN

Este artículo presenta estudios realizados en Brasil relacionados con las evidencias de validez de constructo del test SON-R 2½-7[a], una versión abreviada del SON-R 2½ -7 que tiene estudios de estandarización y validación realizados en varios países europeos. El SON-R 2½-7[a] es un instrumento no verbal que evalúa áreas amplias de inteligencia para niños entre 2½ y 7 años. Los datos de la muestra nacional de normalización de 1.200 niños brasileños se analizaron mediante análisis factorial exploratorio y el análisis factorial confirmatorio. Los resultados apoyan la distinción adoptada para la prueba entre la escala de ejecución y la escala de razonamiento. Los resultados indican una buena validez de constructo del SON-R 2½ -7[a] y sugieren que la prueba es una herramienta prometedora para la evaluación de las capacidades cognitivas de los niños en Brasil.

Palabras-clave: prueba no verbal de inteligencia; validez de constructo; SON-R 2½-7[a].

Muitas definições de inteligência foram apresentadas ao longo de um século de pesquisa, desde as concepções iniciais de Binet, nas quais a inteligência se referia à soma de processos mentais, até as concepções mais modernas que têm como base os modelos hierárquicos (Horn & Blankson, 2012). Observa-se que a busca em compreender o que é inteligência está estritamente ligada à busca de como mensurar a inteligência, uma vez que o instrumento é meio para avaliação do construto. Assim, por muitos anos, os principais testes de inteligência foram construídos tendo como base as teorias psicométricas de Spearman e Thurstone.

Spearman (1904, 1927) desenvolveu a teoria de inteligência geral, afirmando que toda atividade mental intelectual envolveria uma única capacidade, indicando a existência de processos cognitivos comuns aos diferentes tipos de atividades mentais. Em outras palavras, o desempenho nos testes de inteligência depende principalmente de uma única capacidade mental geral, o fator g. A variância específica de cada teste na teoria de Spearman foi considerada como variância de erro. Segundo essa teoria, um conjunto de testes apresenta uma série de fatores s (variância específica) e um fator g (Wasserman, 2012).

Enquanto Spearman acreditava que as correlações entre os subtestes de inteligência eram altas, indicando um fator comum, Thurstone (1938) desenvolveu a hipótese da existência de diversos fatores independentes (Hogan, 2006). A teoria de Thurstone ficou conhecida como a teoria de capacidades mentais primárias. Segundo essa teoria, a inteligência deveria ser descrita em termos de um perfil composto por várias habilidades mentais, e não em termos de um único índice. Somente anos depois de desenvolver a sua teoria, Thurstone veio a admitir a possibilidade de existir um fator g como um fator de ordem maior (Wasserman, 2012).

Depois das teorias de Spearman e Thurstone, apareceram as teorias hierárquicas que concordaram com a existência de diversas habilidades cognitivas, porém acrescentaram que essas habilidades estão organizadas em uma estrutura hierárquica cujo topo tem apenas um fator dominante (Hogan, 2006). Em certo sentido, o surgimento das teorias hierárquicas de inteligência significou uma integração da teoria de um único fator geral e a teoria de múltiplos fatores. Uma das primeiras teorias hierárquicas foi a teoria de Cattell (1963), na qual ele diferencia inteligência fluida de inteligência cristalizada. Cattell criticou o teste de Binet por ser excessivamente verbal e dependente da escolaridade das pessoas e propôs um teste de inteligência perceptual, baseado principalmente em figuras, tais como matrizes e labirintos para evitar viés cultural.

Inteligência cristalizada na teoria de Cattell é definida como as habilidades cognitivas influenciadas por aculturação, escolarização e desenvolvimento da linguagem. Já a inteligência fluida é definida como a representação de raciocínio e a habilidade de resolver problemas novos. Tanto inteligência cristalizada, como inteligência fluida compõe-se de diversos fatores mais específicos, razão pela qual a teoria do Cattell pode ser classificada como uma teoria hierárquica. Uma vez que Cattell elaborou essa teoria junto com Horn (Horn, 1965; Horn, 1994; Horn & Blankson, 2012; Horn & Noll, 1997), a teoria é referida como a teoria Cattell-Horn. Porém, a teoria de Cattell é mais conhecida como a teoria das inteligências cristalizada e fluida, ou simplesmente, como a teoria Gc-Gf.

Outra teoria hierárquica de suma importância é a teoria de três estratos de Carroll (1993, 2012). Carroll desenvolveu a sua teoria por meio de uma reanálise de centenas de conjuntos de dados relacionados à estrutura da inteligência. O pesquisador decidiu reanalisar os conjuntos de dados com técnicas avançadas que não estavam disponíveis na época das primeiras análises. A utilização das mesmas técnicas em todos os conjuntos de dados possibilitou a comparabilidade dos resultados. Depois de reanalisar os bancos de dados, Carroll formulou seu modelo hierárquico de inteligência. O primeiro estrato na teoria de Carroll contém 65 fatores específicos ligados ao formato das tarefas dos testes de inteligência. No segundo estrato, esses fatores específicos são agrupados em oito fatores amplos, a saber: Inteligência Fluida, Inteligência Cristalizada, Memória e Aprendizagem Geral, Percepção Visual, Percepção Auditoria, Fluência de Ideias, Velocidade de Processamento Cognitivo e Velocidade de Decisão. O terceiro estrato corresponde ao fator geral, também chamado de fator g, que agrega os oito fatores amplos do segundo estrato. O fator g reflete a existência de operações cognitivas comuns a todas as atividades mentais. Esse fator corresponde ao fator g de Spearman. A publicação do trabalho monumental de Carroll, Human Cognitive abilities: A survey of factor analytic studies (Carroll, 1993), marcou o início de um processo que finalmente levou a um consenso na comunidade científica com enfoque psicométrico quanto à pertinência de um modelo multidimensional e hierárquico da inteligência.

No final da década de 1990, McGrew e Flanagan elaboraram a teoria CHC (Cattell-Horn-Carroll) sobre a inteligência, propondo um modelo que sintetizava a teoria Gc-Gf de Cattell-Horn (Horn & Noll, 1997) e a Teoria de Três Estratos de Carroll (1993), enfatizando a presença de uma estrutura intelectual hierárquica de três níveis (McGrew, 2009; Schneider & McGrew, 2012). Na teoria CHC são diferenciados 10 fatores amplos (Inteligência Fluida, Conhecimento Quantitativo, Inteligência Cristalizada, Leitura e Escrita, Memória de Curto Prazo, Processamento Visual, Processamento Auditivo, Armazenamento e Recuperação da Memória de Longo Prazo, Velocidade de Processamento e Rapidez de Decisão) e pouco mais de sessenta fatores específicos subjacentes aos fatores amplos. Esse modelo vem gradualmente sendo empregado como uma nomenclatura padrão entre pesquisadores e profissionais no entendimento da inteligência.

Embora no modelo CHC a inteligência fluida (Gf) esteja situada em um nível hierárquico mais específico que o fator geral, ela é, dentre os fatores amplos, a que mais se associa à concepção do fator g de Spearman (1904, 1927). A teoria CHC passou a identificar o fator g como sendo mais próximo à inteligência fluida (Gf), referindo-se à habilidade de raciocinar em situações novas, diferentemente da inteligência cristalizada (Gc) que se refere à habilidade de aplicar definições, métodos e procedimentos, aprendidos previamente, para lidar com situações problema (McGrew, 2009). A inteligência Gf é, portanto, a habilidade mais importante na previsão da capacidade geral de adaptação às situações novas, pouco estruturadas, que requerem autonomia intelectual.

No Brasil, alguns estudiosos do campo da inteligência têm construído instrumentos e realizado pesquisas com o intuito de compreender melhor e aferir a inteligência fluida (Pasquali, 2005; Primi, 2001). O presente trabalho também se configura como uma contribuição para esse campo de estudo, especialmente no âmbito da psicologia infantil, uma vez que tem como objetivo geral investigar evidências da validade do teste não-verbal de inteligência SON-R 2½-7[a] no Brasil.

Os testes SON

Os testes SON (Snijders-Oomen Não-verbal) devem seu nome à criadora do primeiro teste, doutora N. Snijders-Oomen (Snijders-Oomen, 1943). A autora desenvolveu uma bateria de testes que incluiu diversas tarefas não-verbais relacionadas à habilidade espacial e ao raciocínio abstrato e concreto. Inteligência foi definida por Snijders-Oomen em termos do potencial para a aprendizagem. O objetivo do primeiro teste SON era oferecer uma alternativa para os testes não-verbais de execução empregados naquela época e possibilitar que funções como abstração, simbolismo e entendimento de situações comportamentais ficassem mais acessíveis para a avaliação não-verbal. Na construção do primeiro teste SON buscou-se diminuir a influência da escolaridade das crianças e das vivências familiares nos resultados do teste. Dessa forma, o primeiro teste SON buscou medir a inteligência fluida em vez da inteligência cristalizada.

O SON-R 2½-7[a] é a versão abreviada do SON-R 2½-7, a última versão dos testes SON para crianças entre 2½ e 7 anos. Esse instrumento de origem holandesa, que foi normatizado e validado em vários países de Europa, consiste em seis subtestes, a saber: Categorias, Analogias, Situações, Histórias, Mosaicos e Padrões. A versão abreviada do teste composta pelos subtestes Categorias, Situações, Mosaicos e Padrões foi normatizada para o Brasil em 2008 (Laros, Tellegen, Jesus, & Karino, no prelo) e foi aprovada pelo Conselho Federal de Psicologia em 2012 como um teste psicológico em condições de uso profissional.

Os testes tradicionais de inteligência geral, como o Stanford-Binet e os testes de inteligência Wechsler, se centram mais na inteligência cristalizada, ou seja, mais no resultado final da aprendizagem do que no potencial para a aprendizagem. Segundo Tellegen e Laros (2004, 2005), testes de inteligência que aferem principalmente o resultado final da aprendizagem subestimam o potencial para a aprendizagem de pessoas que tiveram poucas oportunidades para adquirir conhecimento e habilidades cognitivas. Em particular, membros de minorias étnicas, pessoas com baixo nível socioeconômico e pessoas com problemas de aprendizagem estariam em desvantagem quando testadas com um teste tradicional de inteligência geral.

De acordo com Tellegen e Laros (2005), os testes tradicionais de inteligência vêm sendo criticados em seu conteúdo por defensores de testes de inteligência culturalmente justos. Testes tradicionais geralmente fazem apelo para habilidades de linguagem específicas, tanto nos conteúdos quanto nas instruções, o que colocariam membros de minorias culturais em desvantagem. Esse argumento também se aplica a pessoas com problemas de linguagem e auditivos. Para todos esses grupos, um baixo desempenho no teste poderia refletir, primariamente, um conhecimento verbal pobre, em vez de raciocínio ou habilidade para aprendizagem pobre. Tais críticas levaram a um aumento no uso de testes não-verbais de inteligência, uma vez que estes testes dependem minimamente do conhecimento adquirido e da habilidade verbal de uma pessoa.

Uma das grandes vantagens dos testes não-verbais diz respeito à maior facilidade para adequação a diferentes culturas, uma vez que o processo de adaptação de testes não-verbais é menos complicado do que o exigido para testes que utilizam linguagem escrita ou falada como parte do seu conteúdo. Não obstante, o fato de os testes não-verbais não exigirem tradução não significa que estes instrumentos possam ser utilizados sem um estudo empírico que verifique sua adequação à cultura na qual será utilizado.

Os testes SON são indicados como exemplo de testes com conteúdo cultural reduzido e que têm como foco a inteligência fluida, isto é, o potencial para aprender. Essas foram as principais razões que impulsionaram o desenvolvimento de estudos com o SON-R 2½-7[a] no Brasil. Ademais, no contexto brasileiro, praticamente não há teste não-verbal de inteligência destinado a toda a faixa etária contemplada pelo SON-R 2½-7[a].

De acordo com dados do Conselho Federal de Psicologia (disponíveis no site deste órgão), até dezembro de 2011, somente os seguintes testes de inteligência para crianças encontram-se com avaliação favorável: o Teste Não-Verbal de Raciocínio para Crianças - TNVRI (Pasquali, 2005); as Escalas de Inteligência Wechsler para Crianças, o WISC-III (Figueiredo, 2002) e o WISC-IV (Sisto, Rueda, Noronha, Santos & Castro, 2012); o Teste Não-Verbal de Inteligência para Crianças – o teste R-2 (Oliveira, Rosa & Alves, 2000); a Escala de Maturidade Mental Colúmbia – o CMMS (Alves, & Duarte, 2001); o teste Matrizes Progressivas de Raven (Angelini, Alves, Custódio, Duarte, & Duarte, 1999) e o Test of Non-verbal Intelligence – o TONI-3, forma A (Santos, Noronha, & Sisto, 2006). Nesse contexto, a presente pesquisa visa contribuir com o campo de avaliação de habilidades cognitivas de crianças, pois pretende demonstrar evidências de validade para o teste não-verbal de inteligência SON-R 2½-7[a].

Método

Participantes

Inicialmente, foi realizado um estudo piloto para avaliar os aspectos gerais do teste. Essa primeira etapa foi realizada em Brasília, com 130 alunos, dos quais 92 de uma creche e 38 do Centro Educacional da Audição e Linguagem (CEAL). Todos os alunos do CEAL apresentavam surdez profunda. Dos 130 participantes, a maioria (52,3%) era do sexo masculino e a idade média das crianças foi 5,0 anos (DP = 1,2).

A amostra da pesquisa principal ficou composta por 1.200 crianças, divididas equitativamente quanto à idade e ao sexo. As crianças do estudo piloto não foram incorporadas na pesquisa principal. Foram estabelecidos 10 grupos de idade entre 3 anos e 3 meses a 7 anos e 9 meses, cada grupo constituído por 120 crianças, sendo tolerável uma variação de três meses em relação à idade pretendida. Não foram incluídas na amostra crianças com deficiência auditiva ou motora. Ao todo, a pesquisa foi realizada nas cinco regiões brasileiras, em 13 estados diferentes, contemplando 36 cidades, conforme a Tabela 1.

Instrumento

O SON-R 2½-7[a] é um teste não-verbal de inteligência composto por quatro subtestes, a saber: Mosaicos, Categorias, Situações e Padrões, administrados nesta ordem. Os quatro subtestes compõem a Escala de Raciocínio (Categorias e Situações) e a Escala de Execução com enfoque espacial (Mosaicos e Padrões).

O subteste Categorias possui 15 itens e um exemplo. Nos primeiros sete itens, quatro ou seis cartões precisam ser postos na categoria correta. Os itens seguintes são de múltipla escolha nos quais a criança deve escolher, entre os cinco objetos, os dois adequados à categoria em análise.

O subteste Situações possui 14 itens e um exemplo. Na primeira parte do subteste são apresentadas metades de quatro figuras. Depois de ter recebido os cartões com as metades faltantes, a criança precisa colocar a metade certa, completando corretamente o desenho. A segunda parte desse subteste é de múltipla escolha. Cada item consiste no desenho de uma situação em que uma ou duas peças estão faltando. As peças corretas precisam ser escolhidas entre várias alternativas a fim de deixar a situação consistente.

O subteste Mosaicos é composto por 15 itens e um exemplo. Na primeira parte, a criança precisa copiar padrões simples de mosaicos numa moldura utilizando 3 a 5 quadrados vermelhos. Na segunda parte, requer-se da criança que padrões de mosaicos sejam copiados com quadrados vermelhos, amarelos e vermelhos/amarelos.

O subteste Padrões é formado por 16 itens. Solicita-se à criança que copie uma forma que lhe é apresentada utilizando um lápis. Os itens inicialmente são demonstrados pelo examinador e, no decorrer da aplicação, a criança precisa copiar a figura sem ajuda. Exemplos dos itens dos quatro subtestes podem ser encontrados no Manual and Research Report do SONR 2½-7 que está disponível no website dos testes SON (www.testresearch.nl).

Procedimento

Inicialmente, o SON-R 2½-7[a] passou por um processo de validação das figuras do subteste Categorias. Esse subteste foi aplicado em cinco crianças com idades na faixa etária do teste. Tanto esse quanto os demais subtestes foram revisados por três especialistas da área de avaliação psicológica que trabalham com crianças. Os problemas detectados nessa fase foram solucionados para que o mesmo pudesse ser aplicado no estudo piloto.

Depois de obter aprovação do Comitê de Ética em Seres Humanos, o estudo piloto foi realizado na cidade de Brasília em duas instituições que atendem crianças na faixa etária de interesse do teste. O manual utilizado no estudo piloto foi previamente traduzido para o português e passou por várias revisões de conteúdo e por revisão de língua portuguesa. O tempo médio de aplicação do SON-R 2½-7[a] no estudo piloto foi de 50 min.

A pesquisa de validação ocorreu junto com a pesquisa de normatização do teste e as aplicações ocorreram em escolas, durante o horário de aula, ou em igrejas e na casa da criança, em horário previamente agendado. Todas as aplicações foram individuais, efetuadas por psicólogos e estudantes de psicologia devidamente treinados. Após a pesquisa, foi entregue aos pais um relatório com os resultados da criança.

Análise dos dados

Foram utilizados múltiplos métodos para verificar a estrutura fatorial do instrumento não-verbal de inteligência. Antes de realizar as análises principais foram realizadas análises exploratórias para verificar a ocorrência de erros na base de dados. Depois dessa fase exploratória foi verificada a fidedignidade dos escores dos quatro subtestes do SON-R 2½-7[a] e das três escalas do SON-R: a Escala de Execução (SON-EE), a Escala de Raciocínio (SON-ER) e a Escala Geral (SON-QI). Na verificação da fidedignidade, usou-se o coeficiente Lambda 2 de Guttman, uma vez que foi comprovado que este estima melhor a fidedignidade do que o coeficiente Alfa de Cronbach (Sijtsma, 2012; Tellegen & Laros, 2004; Ten Berge & Zegers, 1978), principalmente quando os instrumentos contêm poucos itens ou quando a amostra é pequena. Para calcular o coeficiente Lambda 2 foi utilizado o SPSS na sua versão 16.0.

Depois de estimar a fidedignidade, procedeu-se a verificação da estrutura fatorial do SON-R 2½-7[a]. O primeiro procedimento utilizado para isso foi o Full Information Factor Analysis (FIFA), que faz parte do software TESTFACT 4.0 (Wood e cols., 2003). O método FIFA é uma análise fatorial baseado na Teoria de Resposta ao Item. Um problema com o uso de correlações entre itens dicotômicos (os itens dos subtestes do SON-R 2½-7[a] são desse tipo) é que são geralmente afetadas tanto pelo conteúdo dos itens como pelas semelhanças das distribuições estatísticas dos itens (Nunnally & Bernstein, 1994). Itens com distribuições semelhantes tendem a correlacionar mais fortemente entre eles em comparação com itens que têm distribuições dissimilares. Itens fáceis e difíceis tendem a constituir fatores distintos mesmo quando todos os itens estão medindo a mesma variável latente unidimensional (Nunnally & Bernstein, 1994). O método FIFA não tem problema com a análise fatorial de instrumentos com itens dicotômicos, uma vez que ele não exige o cálculo de coeficientes de correlação. Outra vantagem da análise fatorial FIFA é que ela acomoda os efeitos de acerto ao acaso e de itens não apresentados.

O segundo procedimento utilizado para investigar a estrutura fatorial do SON-R 2½-7[a] foi o Simultaneous Component Analysis (SCA), desenvolvido por Millsap e Meredith (1988). O SCA é uma generalização de análise de componentes principais para a análise simultânea de diferentes variáveis observadas em várias populações. O procedimento SCA verifica se uma porcentagem maior da variância é explicada quando se considera grupos separados ao invés de um grupo único (Millsap & Meridith, 1988; Niesing, 1997). Quando a análise nos grupos separados não explica uma porcentagem maior da variância total, podemos concluir que a estrutura fatorial é semelhante nos diversos grupos. O terceiro método que foi empregado na verificação da validade do construto do SON-R 2½-7[a] foi a Análise Fatorial Confirmatória (AFC), utilizando o software LISREL 8.8 (Jöreskog & Sörbom, 2006). Nessa etapa foi testado o ajuste entre o modelo de dois fatores e os dados empíricos. Também foram obtidas evidências sobre a invariância do modelo fatorial em quatro diferentes grupos de idade.

Resultados e Discussão

Estudo Piloto

Embora o estudo de normatização do SON-R 2½-7[a] não contemple crianças com problemas auditivos, o estudo piloto com as crianças surdas no Centro Educacional da Audição e Linguagem (CEAL) serviu para verificar a adequação das instruções não-verbais de aplicação constantes no manual em português. Adicionalmente, buscou-se realizar uma análise inicial da qualidade psicométrica do teste SON-R 2½-7[a] nesse grupo específico de crianças. Os resultados indicaram que as crianças surdas (N=38) entenderam as instruções não-verbais do teste sem problemas. Os coeficientes de fidedignidade (Lambda 2 de Guttman) dos quatro subtestes encontrados nesse grupo foram satisfatórios, com valores variando entre 0,80 a 0,87.

O principal objetivo do estudo piloto com os alunos de creche (N=92) foi verificar a qualidade psicométrica do SON-R 2½-7[a] em um grupo de crianças sem problemas auditivos. Nesse grupo, os coeficientes de fidedignidade para os quatro subtestes variaram entre 0,84 a 0,89. Observou-se que a porcentagem de acerto de itens, em geral, foi decrescente para todos os subtestes. Isso é importante, uma vez que o SON-R 2½-7[a] é aplicado seguindo um procedimento adaptativo.

Estudo principal

Tendo como base a amostra da pesquisa principal, foi primeiramente realizada a análise da consistência interna dos subtestes. De acordo com Cronbach (1996), o coeficiente de consistência interna tende a mudar consideravelmente em função da variância dos escores dos grupos. Nesse contexto, Thompson (2005) enfatiza que a fidedignidade tem que ser calculada para cada pesquisa e que não deve ser simplesmente copiada do manual do teste. Ademais, deve-se considerar que existe uma relação estreita entre a fidedignidade e a variância dos escores: quanto maior a variância, maior é o coeficiente de consistência interna. Nesse sentido, considerando que as diferenças na variância dos escores entre os grupos de idade ocorrem geralmente devido a particularidades da amostragem e que os grupos de idade não são compostos por um quantitativo muito alto de crianças, foi realizado um ajuste nos índices de fidedignidade tendo como base a variância em cada grupo.

Na Tabela 2 são exibidos os coeficientes de fidedignidade nos dez grupos de idade para os escores dos quatro subtestes do SON-R 2½-7[a], para a Escala de Execução (SON-EE), para a Escala de Raciocínio (SON-ER) e para o escore total (SON-QI). Na inspeção da Tabela 2, nota-se que, para todos os grupos de idade, os coeficientes de fidedignidade são superiores a 0,70 para os escores dos subtestes; a 0,80 para as duas escalas (SON-EE e SON-ER) e a 0,90 para o SON-QI. Verificada a consistência interna dos escores dos subtestes, escalas e SONQI, foram feitas as análises de validade de construto que serão apresentadas a seguir.

Análise Fatorial de Informação Plena – FIFA

A Análise Fatorial de Informação Plena (Full Information Factor Analysis – FIFA) foi utilizada para verificar a estrutura fatorial do teste, considerando a escala de resposta dicotômica. Os resultados da FIFA realizada com os dados do SON-R 2½-7[a] podem ser vistos em duas estruturas: com um fator e com dois fatores - Execução e Raciocínio (ver Tabela 3).

Os valores entre parênteses representam as cargas fatoriais da estrutura de um fator. Como pode ser observado, todos os 60 itens saturam no fator único com cargas fatoriais iguais ou superiores a 0,32, que corresponde no mínimo cerca de 10% de variância comum com o fator. De acordo com Tabachnick e Fidell (2007), esse valor é satisfatório. Tais resultados dão suporte à utilização de uma escala total do SON-R 2½-7[a]. Verifica-se também que a média das cargas fatoriais no fator único é mais alta para os subtestes Categorias e Situações.

A estrutura com dois fatores (Execução e Raciocínio) foi obtida utilizando-se a rotação Promax. Como pode ser observado, os dois fatores apresentam em geral cargas fatoriais satisfatórias, a maioria superior a 0,32. Entre os itens com carga fatorial menor do que 0,32 estão os itens mais fáceis dos subtestes Mosaicos e Categorias e os mais difíceis dos subtestes Mosaicos, Padrões e Situações. As cargas fatoriais baixas desses itens foram provavelmente influenciadas pela pouca variabilidade de resposta. É interessante notar também que, no fator execução, o subteste Padrões apresenta cargas fatoriais mais altas. Por fim, a correlação encontrada entre os dois fatores foi alta, 0,80. Frente aos resultados, considera-se que a estrutura bifatorial também se mostra válida.

Análise Simultânea dos Componentes Principais – SCA

No processo de validação do SON-R 2½-7, na Holanda, foi efetuada uma análise fatorial com os escores normatizados dos subtestes (M=10 e DP=3) utilizando a Análise Simultânea dos Componentes Principais (SCA) (Kiers & Ten Berge, 1989; Millsap & Meredith, 1988). Os resultados da análise fatorial na Holanda indicaram que a estrutura fatorial foi similar em três grupos de idade. A análise que foi efetuada com os dados brasileiros teve como objetivo verificar se a estrutura interna do teste, no Brasil, também é similar em três grupos diferenciados de idade, a saber: (1) 3;3 a 4;3; (2) 4;9 a 6;3 e (3) 6;9 a 7;9. A SCA se baseia nas três matrizes de correlação dos escores normatizados dos subtestes. Por meio dessa análise, foi testado se uma solução uniforme com pesos otimizados dos componentes nos três grupos explica significativamente menos da variância total do que os componentes que são otimizados nos grupos separados (Millsap & Meridith, 1988; Niesing, 1997). Os resultados indicaram que, com a extração de dois componentes, a solução uniforme foi ligeiramente menos adequada (80,1% vs. 80,2% da variância total explicada nos grupos separados). Assim, as características estruturais do SON-R 2½-7[a] demonstraram ser altamente independentes dos grupos de idade. Outro resultado da análise SCA é que o uso de pesos simples (1 e 0) é quase tão bom quanto pesos otimizados (79,92% vs. 80,05%).

Não obstante a boa consistência da estrutura interna do SON-R 2½-7[a] nos diferentes grupos, pode-se observar que o segundo componente antes da rotação é relativamente menos importante: o autovalor do segundo componente foi cerca de 0,60. Entretanto, o autovalor do segundo componente tende a aumentar com o aumento da idade, conforme a Tabela 4. É uma indicação de que a solução com dois fatores ficou ligeiramente mais adequada para o grupo de idade mais velho. Provavelmente, a precisão da diferença entre o fator espacial e o de raciocínio não é tão alta. Portanto, conclusões importantes não podem ser baseadas nessas diferenças. Mais detalhes da análise com o programa SCA (Kiers, 1990) podem ser vistos na Tabela 4.

Além do percentual de variância explicada dos dois fatores nos três grupos de idade, a Tabela 4 também apresenta as cargas fatoriais dos dois fatores no grupo total de idade. O resultado demonstra cargas expressivas em ambos os fatores. Dessa forma, os resultados apresentados dão suporte à utilização e interpretação do SON-R 2½-7[a] por meio de duas escalas em diferentes grupos de idade.

Análise Fatorial Confi rmatória – CFA

A Análise Fatorial Confirmatória (CFA) é um procedimento estatístico viabilizado pelos Modelos de Equações Estruturais (Byrne, 2010; Kline, 2011; Pilati & Laros, 2007). Inicialmente, foi verificado se a estrutura fatorial do SON-R 2½-7[a] com dois fatores, Escala de Execução e Escala de Raciocínio, se confirmava. Também se buscou verificar a invariância dessa estrutura em quatro grupos diferentes de idade, a saber: 3;3 a 7;9; 3;3 a 4;3; 4;9 a 6;3 e 6;9 a 7;9. A CFA realizada neste estudo foi executada por meio do pacote estatístico LISREL 8.8, tendo como método de estimação a máxima verossimilhança. A Tabela 5 apresenta um resumo dos resultados.

Como pode ser observado na Tabela 5, todas as cargas fatoriais são moderadas ou altas e o erro associado é bastante pequeno. Os índices de correlação múltipla ao quadrado (SMC) também indicam resultados muito satisfatórios.

Além dos dados apresentados na Tabela 5, as estatísticas de ajuste ao modelo foram verificadas. Conforme sugere Byrne (2010), os índices avaliados foram o GFI (Goodness of Fit Index) e o AGFI (Adjusted Goodness of Fit Index). A literatura aponta que valores desses índices entre 0,90 e 0,95 são indicadores de ajuste suficiente e valores acima de 0,95 são considerados bons ajustes (Kline, 2011). Ademais, faz parte das estatísticas de ajuste o RMSEA (Root Mean Square Error of Approximation), descrito como a falta de ajuste dado um número particular de parâmetros no modelo testado. Valores inferiores a 0,05 para RMSEA indicam um bom ajuste (Byrne, 2010; Pilati & Laros, 2007).

No modelo testado para os quatro grupos de idade, verificou-se que tanto o GFI quanto o AGFI obtiveram valores superiores a 0,95, indicando um ajuste bom do modelo. Quanto ao RMSEA, com exceção do grupo com idade entre 3 anos e 3 meses e 4 anos e 3 meses, que obteve um índice de 0,07, os demais grupos apresentaram valores inferiores a 0,05. Esses resultados indicam que a estrutura do SON-R 2½-7[a] com dois fatores é robusta e foi confirmada nos quatro grupos de idade.

Considerações finais

O presente estudo teve como objetivo principal obter evidências de validade de construto do teste SON-R 2½-7[a]. Dessa forma, buscou-se contribuir para a área de avaliação psicológica infantil, uma vez que a faixa etária abordada no teste é muito importante, sobretudo, para a intervenção precoce (Campbell & Ramey, 1995).

Três técnicas de análises foram utilizadas neste estudo para obter evidências de validade de construto do teste SON-R 2½-7[a]: Análise Fatorial de Informação Plena – FIFA, Análise Simultânea dos Componentes Principais – SCA e Análise Fatorial Confirmatória – CFA. De modo geral, os resultados das análises embasam o uso do SON-R 2½-7[a] com uma escala geral e com duas escalas específicas: Execução e Raciocínio. Ademais, tanto na SCA quanto na CFA foi avaliada a robustez da estrutura fatorial de duas escalas em três grupos distintos de idade: (1) 3;3 a 4;3; (2) 4;9 a 6;3 e (3) 6;9 a 7;9 anos. Verificouse que sua estrutura é invariante tanto no grupo total de crianças, com idade entre 3;3 a 7;9 anos, quanto dividindo- se a amostra em três grupos distintos de idade.

Assim, de maneira geral, os estudos de validade realizados indicam que o SON-R 2½-7[a] é um teste válido, fidedigno e robusto em sua estrutura interna. Esta pesquisa aponta, ainda, que se trata de um teste com alta qualidade psicométrica e com índices de confiabilidade adequados para uso nas diferentes faixas etárias contempladas pelo teste.

Outros estudos ainda podem ser feitos na busca de evidência de validade de construto do teste SON-R 2½-7[a]. Por exemplo, a análise da invariância da estrutura fatorial em amostras diferentes e a análise da adequabilidade do modelo comparando-se os índices de ajuste dos dados em modelos alternativos, conforme sugere Thompson (2005).

Há décadas, pesquisadores e estudiosos da área de inteligência procuram evidências sobre a arquitetura intelectual humana. Este estudo fornece mais uma contribuição para o avanço da compreensão da inteligência, em especial no desenvolvimento de testes que buscam mensurar a inteligência fluida.

A aferição da inteligência geralmente é realizada com o objetivo de avaliação diagnóstica e os seus resultados têm consequências importantes tanto para a vida escolar como para a formulação de recomendações para a criação de programas especiais de educação e tratamento das desordens (Hutz & Bandeira, 1993; International Test Commission, 2003). Considerando o impacto dos testes na vida de milhares de pessoas, espera-se que esta pesquisa tenha contribuído para área ao colaborar com o processo de validação do teste SON-R 2½-7[a].

Referências

Alves, I. C. B. & Duarte, J. L. M. (2001). Escala de maturidade mental Colúmbia: Manual para aplicação e interpretação. São Paulo: Casa do Psicólogo. [ Links ]

Angelini, A. L., Alves, I. C. B., Custódio, E. M., Duarte, W. F., & Duarte, J. L. M. (1999). Manual Matrizes Progressivas Coloridas de Raven: escala especial. São Paulo: CETEPP - Centro Editor de Testes e Pesquisas em Psicologia. [ Links ]

Byrne, B. M. (2010). Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming (2ª ed.). New York: Routledge Academic. [ Links ]

Campbell, F. A. & Ramey, C. T. (1995). Cognitive and school outcomes for high-risk African-American students at middle adolescence: positive effects of early intervention. American Educational Research Journal, 32(4), 743-772. [ Links ]

Carroll, J. B. (1993). Human cognitive abilities: A survey of factor analytic studies. New York: Cambridge University Press. [ Links ]

Carroll, J. B. (2012). The three-stratum theory of cognitive abilities. Em D. P. Flanagan & P. L. Harrison (Org.), Contemporary intellectual assessment: Theories, tests, and issues, Third Edition (pp. 883-890). New York: The Guilford Press. [ Links ]

Cattell, R. B. (1963). Theory of fluid and crystallized intelligence: a critical experiment. Journal of Educational Psychology, 54, 1-22. [ Links ]

Cronbach, L. J. (1996). Fundamentos da testagem psicológica (5ª ed.). Porto Alegre: Artes Médicas. [ Links ]

Figueiredo, V. L. M. (2002). Padronização brasileira das Escalas Wechsler de Inteligência para Crianças, Terceira Edição - WISC-III. Em D. Wechsler (Org.), WISC-III: Escala de Inteligência para Crianças: Manual. São Paulo: Casa do Psicólogo. [ Links ]

Hogan, T. P. (2006). Introdução à prática de testes psicológicos. Rio de Janeiro: LTC – Livros e Técnicos e Científicos Editores S. A.

Horn, J. L. (1965). Fluid and crystallized intelligence: A factor analytic and developmental study of the structure among primary mental abilities. Unpublished doctoral dissertation, University of Illinois. [ Links ]

Horn, J. L. (1994). Theory of fluid and crystallized intelligence. Em R. J. Sternberg (Org.), Encyclopedia of human intelligence (pp. 443-451). New York: MacMillan. [ Links ]

Horn, J. L. & Blankson, A. N. (2012). Foundations for better understanding of cognitive abilities. Em D. P. Flanagan & P. L. Harrison (Org.), Contemporary intellectual assessment: Theories, tests, and issues (3ª ed., pp. 73-98). New York: The Guilford Press. [ Links ]

Horn, J. L. & Noll, J. (1997). Human cognitive capabilities: Gf-Gc theory. Em D. P. Flanagan, J. L. Genshaft, & P. L. Harrison (Org.), Contemporary intellectual assessment: Theories, tests and issues (pp. 53-91). New York: The Guilford Press. [ Links ]

Hutz, C. & Bandeira, D. (1993). Tendências contemporâneas no uso de testes, uma análise da literatura brasileira e internacional. Psicologia: Reflexão e Crítica, 6, 85-101. [ Links ]

International Test Commission (2003). Diretrizes para o uso de testes: International Test Commission (ITC). Versão em Português. Retirado no World Wide Web: http://www.ibapnet.org.br/ diretrizesITC.pdf [ Links ]

Jöreskog, K. G. & Sörbom, D. (2006). LISREL for Windows [Computer software]. Lincolnwood, IL: Scientific Software International. [ Links ]

Kiers, H. A. L. (1990). SCA: a program for simultaneous component analysis. Groningen: IEC, ProGamma. [ Links ]

Kiers, H. A. L. & ten Berge, J. M. F. (1989). Alternating least squares algorithms for simultaneous component analysis with equal weight matrices in two or more populations. Psychometrika, 54, 467-473. [ Links ]

Kline, R. B. (2011). Principles and practice of structural equation modeling (3ª ed.). New York: Guilford Press. [ Links ]

Laros, J. A., Tellegen, P. J., Jesus, G. R., & Karino, C. A. (no prelo). SON-R 2½-7[a], Teste não-verbal de inteligência. Manual com normatização e validação brasileira. Porto Alegre: Casa do Psicólogo. [ Links ]

McGrew, K. S. (2009). CHC theory and the human cognitive abilities project: Standing on the shoulders of the giants of psychometrics. Intelligence, 37, 1-10. [ Links ]

Millsap, R. E. & Meredith, W. M. (1988). Component analysis in cross-sectional and longitudinal data. Psychometrika, 53, 123-124. [ Links ]

Niesing, J. (1997). Simultaneous component and factor analysis methods for two or more groups: A comparative study. M & T Series, 30. Leiden: The Netherlands, DSWO Press. [ Links ]

Nunnally, J. C. & Bernstein, I. H. (1994). Psychometric Theory (3ª ed.). New York: McGraw-Hill. [ Links ]

Oliveira, R., Rosa, H. R., & Alves I. C. B. (2000). R-2. Teste não verbal de inteligência para crianças: Manual. São Paulo: Vetor. [ Links ]

Pasquali, L. (2005). Manual técnico e de aplicação do teste não-verbal de raciocínio para crianças - TNVRI. São Paulo: Vetor Editora. [ Links ]

Pilati, R. & Laros, J. A. (2007). Modelos de equações estruturais em psicologia: conceitos e aplicações. Psicologia: Teoria e Pesquisa, 23(2), 205-216. [ Links ]

Primi, R. (2001). Complexity of geometric inductive reasoning tasks: Contribution to the understanding of fluid intelligence. Intelligence, 30, 41-70. [ Links ]

Santos, A. A. A., Noronha, A. P. P., & Sisto, F. F. (2006). Teste Não-Verbal de Inteligência (TONI-3, Forma A). São Paulo: Vetor Editora. [ Links ]

Schneider, W. J. & McGrew, K. S. (2012). The Cattell-Horn-Carroll model of intelligence. Em D. P. Flanagan & P. L. Harrison (Org.), Contemporary intellectual assessment: Theories, tests, and issues, (3ª ed., pp. 99-144). New York: The Guilford Press. [ Links ]

Sijtsma, K. (2012). Future of psychometrics: Ask what psychometrics can do for psychology. Psychometrika, 77, 4-20. [ Links ]

Sisto, F. F., Rueda, F. J. M., Noronha, A. P. P., Santos, A. A. A., & Castro, N. R. (2012). Escala de Inteligência Wechsler para Crianças – WISC-IV. São Paulo: Casa do Psicólogo.

Snijders-Oomen, N. (1943). Intelligentieonderzoek van doofstomme kinderen [The examination of intelligence with deaf-mute children]. Nijmegen: Berkhout. [ Links ]

Spearman, C. (1904). “General intelligence” objectively determined and measured. American Journal of Psychology, 15, 201-293.

Spearman, C. (1927). The abilities of man: Their nature and measurement. New York: Macmillan. [ Links ]

Tabachnick, B. G. & Fidell, L. S. (2007). Using multivariate statistics (3a ed.). Northridge, CA: Harper Collins College. [ Links ]

Tellegen, P. J. & Laros, J. A. (2004). Cultural bias in the SON-R test: comparative study of Brazilian and Dutch children. Psicologia: Teoria e Pesquisa, 20(2), 103-111. [ Links ]

Tellegen, P. J. & Laros, J. A. (2005). Fair assessment of children from cultural minorities: a description of the SON-R non-verbal intelligence tests. Slovakia: Paper presented at the UNESCO seminar. [ Links ]

Ten Berge, J. M. F. & Zegers, F. E. (1978). A series of lower bounds to the reliability. Psychometrika, 43(4), 575-579. [ Links ]

Thurstone, L. L. (1938). Primary mental abilities. Chicago: University of Chicago Press. [ Links ]

Thompson, B. (2005). Exploratory and confirmatory factor analysis: Understanding concepts and applications. Washington, DC: American Psychological Association. [ Links ]

Wasserman, J. D. (2012). A history of intelligence assessment. Em D. P. Flanagan & P. L. Harrison (Org.), Contemporary intellectual assessment: Theories, tests and issues (3ª ed., pp. 3-55). New York: The Guilford Press. [ Links ]

Wood, R., Wilson, D. T., Gibbons, R., Schilling, S. G., Muraki, E., & Bock, R. D, (2003). TESTFACT (Version 4.0). Mooresville, IN: Scientific Software International. [ Links ]

Recebido em agosto de 2012
Reformulado em janeiro de 2013
Aprovado em fevereiro de 2013

Sobre os autores

Jacob Arie Laros: é Doutor PhD em Personality and Educational Psychology pela University of Groningen e pós-doutor pela University of Groningen. Atualmente é professor da pós-graduação em Psicologia Social, do Trabalho e das Organizações (PSTO) da Universidade de Brasília (UnB) e bolsista de produtividade em pesquisa do CNPq. E-mail: jalaros@unb.br
Girlene Ribeiro de Jesus: é graduada em Psicologia pela Universidade Federal da Paraíba. Mestre e Doutora em Psicologia pela Universidade de Brasília.
Camila Akemi Karino: é bacharel em psicologia e psicóloga pela Universidade de Brasília. Mestre pelo Programa de Pós-graduação em Psicologia Social, do Trabalho e das Organizações da UnB. Atualmente, é coordenadora-geral de Instrumentos e Medidas do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP).

¹Este artigo é resultado da tese de doutorado da segunda autora, sob a orientação do primeiro autor.

²Trabalho realizado com apoio do Conselho Nacional de Desenvolvimento Científi co e Tecnológico (CNPq) e do Fundo SON da Rijksuniversiteit Groningen (RuG), Holanda.

³Endereço para correspondência: Universidade de Brasília, Instituto de Psicologia – IP, Instituto Central de Ciências (ICC) / Ala Sul, sala A1-061/4, Laboratório de Métodos e Técnicas de Avaliação – META, 70910-900, Brasília-DF. Tel.: (61) 3107-6902. E-mail: jalaros@gmail.com