SciELO - Scientific Electronic Library Online

 
vol.41 número2Validity of moral norms: perspectives of philosophy and psychoanalysisTrabalho em equipe: um estudo multimetodológico em instituição hospitalar de reabilitação índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Interamerican Journal of Psychology

versão impressa ISSN 0034-9690

Interam. j. psychol. v.41 n.2 Porto Alegre ago. 2007

 

 

Dibujo de la figura humana: análisis del funcionamiento diferencial de los criterios

 

Human figure drawing: an analysis of the differential functioning of the criteria

 

 

Fermino Fernandes Sisto1

Universidade São Francisco, Itatiba, Brasil

 

 


RESUMEN

Esta investigación ha tenido como objetivo la determinación del funcionamiento diferencial del ítem (DIF) en el test del Dibujo de la Figura Humana utilizado para la estimativa de la inteligencia en niños, considerando la variable sexo. Han sido estudiados protocolos de 2508 estudiantes de la enseñanza primaria y preescolar, cuyo promedio de edad fue de 8,14 años. Gran parte de ellos frecuentaban escuelas públicas (72,1 %) y los grupos para el estudio de DIF fueron compuestos por 1248 niños y 1260 niñas. Los parámetros métricos de los ítems fueron determinados según el modelo logístico de un parámetro de Rasch. Los resultados han indicado la presencia de DIF en 20 de los 46 ítems analizados, siendo que nueve de ellos han sido de fácil ejecución para las niñas y 11 para los niños.

Palabras clave:Funcionamiento diferencial del ítem (DIF), Dibujo de la figura humana, Evaluación psicológica, Teoría de Respuesta al Ítem (TRI).


ABSTRACT

This research aimed the determination of the differential item functioning (DIF) in the Human Figure Drawing used for the intelligence assessment in children, taking into account the sex variable. A sample of 2508 kindergarten and elementary school students, whose average age was 8.14 years, was studied. The majority of them was composed by students from public schools (72.1%) and the groups for the study of DIF were composed by 1248 men and 1260 women. The metric parameters of the items were determined according to the Rasch model of one logistic parameter. The results indicated the presence of DIF in 29 of 46 analyzed items; more specifically nine items were easy for the girls and 11 for the boys.

Keywords: Differential items functioning (DIF), Human figure drawing, Psychological assessment, Item response theory (IRT).


 

 

La primera revisión del sistema de Goodenough para la evaluación del dibujo de la figura de un hombre fue propuesta por Harris en 1963 (Harris, 1991) y es conocido como el test del Dibujo de la Figura Humana de Goodenough-Harris. Ha ampliado el sistema de puntaje de 51 ítems para 73 interpretándolo como una medida de la madurez conceptual. Se ha solicitado que las personas dibujasen una mujer y a si mismas. Asimismo, la tendencia de las niñas para ejecutar consistentemente mejor que los niños se mantuvo en sus datos. El manual relata una gran cantidad de estudios de correlación y los coeficientes han variado entre 0,27-0,72. En general presentaron concordancia con los estudios relatados por Goodenough (1926).

Por su parte, el sistema Koppitz (1968) solicita que el niño dibuje apenas una persona y su sistema de corrección incluye 30 ítems. Ha conservado integralmente 15 de los ítems de Goodenough (1926) y los otros resultaron de cambios hechos en los originales. En lo que atañe a la evidencia de validez, una buena parte de ella es dada por inspección visual de los resultados y se refiere al aumento de la frecuencia de ocurrencia en función de la edad, efectos del aprendizaje y de la madurez, y en relación a los puntajes de los tests WISC y Stanford-Binet.

Naglieri (1988) también se propuso a desarrollar un sistema de puntaje con normas actualizadas para evaluar dibujos de niños y adolescentes. Ha propuesto cuatro categorías y criterios para evaluar los dibujos hechos independientemente de que fueran un hombre, una mujer y de si mismo. En cuanto a la validez de constructo, el autor ha presentado dos estudios en los cuales ha correlacionado sus puntajes con el sistema Goodenough-Harris, cuyos coeficientes han variado entre 0,75 y 0,87. Ha hallado incluso correlaciones con instrumentos de capacidad académica e intelectual, que fueron significativos, a pesar de muy bajos. Al estudiar las diferencias entre sexos ha quedado evidente la diferencia en las tres figuras dibujadas.

La literatura sobre el dibujo de la figura humana es bastante aventajada. Hay muchos estudios que investigaron su uso y en los Estados Unidos ya estuvo entre los tres más usados (Louttit & Browne, 1947), o en octavo (Brown & McGuire, 1976). Evaluando la utilización de tests por área Goh, Teslow y Fuller (1981) han hallado que el test de Goodenough fue el segundo más citado por el criterio de uso.

La detallada revisión (de 1963 la 1977) de Scott (1981) de la propuesta de Goodenough-Harris (Harris, 1991) ha 1993; por ejemplo) contra-argumentaron que algunos estudios realmente han hallado poca evidencia de validez para su uso, pero nuevas interpretaciones y sistemas para la evaluación de la Figura Humana estarían disponibles y los críticos parecen no tener eso en cuenta.

En el Brasil hay investigaciones estudiando el DFH en relación al nivel socioeconómico de preescolares (Van Kolck, 1981), diferencias entre sexos (Almeida, 1959), niños deficientes mentales (Carvalho, 1960), relaciones entre tests de inteligencia (Carvalho, 1960), relaciones con pruebas piagetianas (Sisto, 2000), desempeño escolar (Bandeira & Hutz, 1994), estandarización (Antipoff, 1931; Hutz & Antoniazzi 1995), validez y estandarización (Alves, 1981; Sisto, 2005), entre otras. En suramerica es también estudiado (Barros & Ison, 2002; por ejemplo).

Principalmente dos hechos son constantes en la literatura sobre el DFH. Uno de ellos se refiere a la validez para evaluar la inteligencia de las personas y la otra la diferencia entre los géneros, diferencia esa ya apuntada por Goodenough (1926). Con base en esas informaciones se ha elegido estudiar el aspecto referente a la validez interna de los ítems, más específicamente en relación al funcionamiento diferencial de los ítems en lo que atañe a los géneros.

El tema no es nuevo. Binet y Simon (1916) al estudiar niños de status socioeconómico más bajo que tenían un rendimiento peor en algunos ítems de su test, han planteado la posibilidad de que ellos podrían estar midiendo efectos de aprendizaje cultural y no de capacidad mental.

Es sabido que cuando un test tiene en cuenta los requisitos psicométricos de precisión y validez proporcionará medidas de personas con un margen de error muy pequeño. Los sesgos de los ítems pueden ser calificados teniendo problemas concernientes a la posibilidad de interpretación de los resultados del test, es decir, el grado en que el conjunto de ítems mide un rasgo o constructo. En ese sentido, en la teoría de los tests la probabilidad de que un examinado responda a un ítem correctamente se denomina probabilidad de éxito y los sesgos pueden ser estudiados comparando las probabilidades de éxito para diferentes subgrupos de una misma población. En otros términos, si el puntaje obtenido es función no sólo del nivel de los sujetos en la variable medida, sino también de otras características irrelevantes como pertenecer a diferentes grupos étnicos, culturales, entre otros, o en función de variables tales como sexo, o experiencia instruccional recibida, se trata de funcionamiento diferencial del ítem (DIF). Más específicamente, se refiere a una diferencia entre un grupo de referencia (personas del sexo masculino) y un grupo focal (personas del sexo femenino) en la probabilidad de acertar un ítem. Así, un ítem sesgado será aquel cuyas probabilidades de éxito son diferentes, pese a la igualdad de capacidad de las personas que respondieron a él. Por las implicaciones éticas, sociales y jurídicas involucradas en la utilización de tests que pueden subestimar sistemáticamente las capacidades de ciertos grupos, los estudios para neutralizar ese efecto son de importancia indiscutible. enseñado algunos aspectos que merecen destacarse. Además de ser un estudio bastante amplio, ha comprendido aproximadamente 100 publicaciones, ha procurado demarcar los límites y alcances del test reformulado, como también analizar si los trabajos poseerían estructura y cuerpo suficiente para sacar conclusiones.

La propuesta Goodenough-Harris (Harris, 1991) al ser correlacionada con la original de Goodenough (1926) ha mostrado coeficientes alrededor del 0,86, en relación a la figura del hombre, común a las dos escalas. Estudiada con otras 14 medidas de inteligencia el coeficiente promedio fue alrededor de 0,49. Comparada al Wisc-R y al Stanford-Binet se ha constatado que hubo una tendencia a subestimar los puntajes de las personas, notablemente en los intervalos superiores de la inteligencia.

Uno de los hallazgos de Scott (1981) fue que, a pesar de ser pocos los estudios, los resultados han sugerido que los puntajes del test original de Goodenough (1926) se aproximarían más a los tests de inteligencia. Añádase a eso el hecho de que el test Goodenough-Harris (Harris, 1991) ha demostrado poca utilidad para predecir la realización académica, a diferencia del sistema de Goodenough.

Scott (1981) ha relatado también que en 24 de las 33 comparaciones entre los sexos encontradas en los estudios analizados no fue señalada diferencia significativa alguna. En las 9 que han informado diferencias significativas, las niñas han obtenido puntajes más altos que los niños en siete casos. Sin embargo, no fue observada ninguna característica que pudiera justificar ese resultado. A ese respecto, en el estudio de Sinha (1970) el resultado del análisis factorial ha sugerido que los niños han tenido más preocupaciones en relación a la proporción y que las niñas han estado más atentas a los detalles.

Entre otras conclusiones Scott (1981) ha afirmado que todo indica que el test de Goodenough-Harris es una medida estable y confiable, pero seria un predictor pobre del desempeño en los principales tests de inteligencia. Sin embargo, podría ser interesante si usado como screening para seleccionar personas con inteligencia abajo del promedio.

Investigaciones posteriores han informado que no obstante su uso difundido no fue posible comprobar que el Dibujo de la Figura Humana por el sistema Goodenough-Harris mediría la inteligencia como las Matrices Progresivas de Raven, la Escala de Inteligencia de Stanford-Binet-Binet, el Porteus Maze Test, el Wisc-R y la Escala de Inteligencia de Wechsler para niños, entre otras, parecen capaces de hacer (Abell, Von Briesen, & Watz, 1996; Harris, 1991; White, 1979).

Además de eso, investigaciones han señalados resultados poco estimulantes para el uso de ese sistema para estimar la inteligencia de niños (Aikman, Belter, & Finch, 1992; Kamphaus & Pleis, 1991). Más aún, algunos investigadores (Gresham, 1993; Motta, Little, & Tobin, 1993a; Motta, Little, & Tobin, 1993b) argumentaron que pese a que no se puede negar la validez de uso del Dibujo de la Figura Humana de Goodenough-Harris, otros tests han proporcionado resultados más válidos, lo que haría superfluo su uso. En compensación, otros autores (Bardos,

Hay dos tipos de abordaje para la detección del sesgo de los tests. Una de ellas utiliza un criterio externo al test y la otra un criterio interno, normalmente los puntajes obtenidos en el test como un todo. En este estudio, el interés está en el sesgo interno que se refiere a las propiedades psicométricas de los ítems de los tests. En realidad se buscará responder si los ítems del test DFH poseen el mismo comportamiento estadístico (o equivalencia de medida) cuando son comparados a subgrupos de sujetos pertenecientes a la misma población. En el caso de que ese hecho sea observado, la conclusión es que no hay funcionamiento diferencial de los ítems (DIF); cuando la equivalencia no es constatada, se concluye por la presencia de DIF.

Hay diversos procedimientos para el estudio del funcionamiento diferencial del ítem (DIF), los cuales pueden clasificarse entre los que aplican la Teoría de Respuesta al Ítem (TRI) y los llamados de tablas de contingencia (Aguerri, Zanelli, & Galibert, 2002; Aguerri, Galibert, Zanelli, & Attorresi, 2005; Benito & Ara, 1998; Fidalgo, 1996; Fidalgo, Mellenbergh, & Muñiz, 1998; Galibert, Aguerri, & Attorressi, 2000; Gómez & Hidalgo, 1997; Marañón, García, & Costas, 1999; Millsap & Everson, 1993). El modelo usado en este estudio fue el modelo logístico de Rasch (Rasch, 1960; Wright & Panchapakesan, 1969). Ese modelo puede incorporar gran parte de los trabajos precedentes sobre sesgo porque empieza con suposiciones similares de medida. Pero como sus procedimientos son extensiones racionales del modelo, el análisis del sesgo puede ser buscado adicionalmente y de manera más sistemática y más integrada de lo que ha sido hecho. En particular, ese procedimiento identifica los ítems que pueden conducir a una medida válida para toda la persona y pueden consecuentemente ser usados para detectar y corregir no solamente medidas sesgadas para cualquier grupo sino también para detectar una medida sesgada para el individuo.

 

Método

Participantes

Fueron investigados 2508 niños, siendo que el 49,76% (1248) era del sexo masculino y el 50,24% (1260) del sexo femenino. Esos niños frecuentaban desde la educación preescolar hasta en el curso cuarto de enseñanza primaria, en escuelas públicas (72,1%) y particulares (27,9%). Las escuelas se ubicaban en ocho diferentes ciudades del interior paulista. Las edades variaron entre 5 y 10 años, con un promedio de 8,1 (moda y mediana de 8,0) y una desviación típica de 1,30. La concentración más pequeña de niños se ha dado entre los que recibían educación preescolar, que fue poco más del 9% del total. En contraposición, la frecuencia más grande ha ocurrido en las edades de los 7 a los 10 años, comprendiendo más del 90% de las personas estudiadas.

Administración y criterios de corrección

La consigna para los niños fue que ellos dibujasen una persona lo más detallada posible, usando un lápiz y una hoja de papel. Les fue permitido borrar el dibujo para correcciones. La administración fue colectiva a todos los niños de cada aula y se tardó un año lectivo para reunir todos los protocolos.

Los protocolos fueron corregidos basándose en los 51 detalles o criterios propuestos por Goodenough (1928). En todos los protocolos fue observada la presencia de cabeza, pierna y brazo mientras que dos otros criterios (perfil A y perfil B) no han tenido ocurrencia suficiente para análisis, así que esos ítems no han tenido variabilidad suficiente para cualquier análisis y fueron descartados. En total fueron usados 46 ítems para estudio y la amplitud posible del instrumento fue de 0-46. A los ítems les fue atribuido el valor de uno cuando el detalle estaba presente y de cero cuando el detalle estaba ausente.

Análisis

Fue usado el modelo Rasch por medio el programa Winsteps para los análisis. Primeramente, fueron estimadas las dificultades de los ítems para, a continuación, separar la distribución de la aptitud para cada una de las personas de los dos grupos. En otros términos, el modelo corrige la estimativa de las dificultades de los ítems por la distribución de la aptitud de la persona. En consecuencia, la dificultad estimada debería ser estadísticamente equivalente para los grupos en el caso de que ellos si distingan por tan solamente la distribución de sus aptitudes.

Finalmente, el modelo calcula cuánto de DIF es añadido (positiva y negativamente) al ítem y, por la prueba t de Student, estima si la diferencia puede ser atribuida al acaso o no (Wright, Mead, & Draba, 1976). Frecuentemente un valor de t de más de 2 es considerado significativo. Pese a eso, Draba (1977) concordando con Bonferroni, considera que 2,4 es un buen índice cuando se está analizando más de 20 ítems como es el caso del presente estudio.

 

Resultados

Los estadísticos descriptivos han mostrado que la media del grupo fue de 17,52 (SD=7,09) y el error estándar de 0,14. Los puntajes obtenidos han variado entre 0-46 puntos y la distribución de los datos fue bastante parecida a una curva normal simétrica. La media del grupo femenino (18,09) fue mayor que la obtenida por el grupo masculino (16,96), siendo la diferencia entre ellos significativa (t=-4,06; p=0,000).

Para verificar el ajuste al modelo Rasch fueron analizados los valores de infit y outfit, cuyo valor esperado es de 1. Se consideran que los valores superiores a 1,5 indican un desajuste moderadamente alto y los superiores a 2,0 muy alto, de tal manera que perjudican gravemente las medidas (Wright & Linacre, 1998). Los resultados del análisis del ajuste de los ítems al modelo y de los participantes están en la Tabla 1.

 

 

Así que en relación al infit, todos los ítems se han ajustado al modelo como también las medias y las desviaciones típicas de los valores del infit y outfit han sido las esperadas cuando no hay divergencias substanciales entre las previsiones del modelo y los datos empíricos. A su vez, en lo que atañe al outfit tres detalles no han presentado ajuste, lo que supone que respuestas inesperadas en relación al nivel de aptitud fueron dadas, dos de ellas bastante preocupantes. Sin embargo, mientras que el infit es más robusto el outfit es un indicador bastante sensible a los outliers (anómalos), puesto que los altos valores se deben a respuestas netamente absurdas. Hay que considerar, también, que el porcentaje de los sujetos que no se han ajustado al modelo fue muy bajo.

En la Tabla 2 se presentan las estadísticas descriptivas de los parámetros de los ítems y de las personas. La fiabilidad fue alta tanto para las personas cuanto para los ítems. La amplitud medida fue bastante alta (10,06).

 

 

Aplicadas las técnicas de detección del funcionamiento diferencial de los ítems se ha identificado que de los 46 ítems estudiados, 20 de ellos ha diferenciado los sexos. Las Tablas 3 y 4 presentan los ítems fáciles para los sexos femenino y masculino, respectivamente, la adición para cada sexo, los valores de los cambios observados, los valores de t y la dificultad del ítem. Como puede ser observado, nueve ítems fueron de fácil ejecución para las niñas y 11 para los niños.

 

 

Comparando esos resultados a los de Goodenough (1926) se ha observado que de los 11 ítems indicados por ella como característicos del sexo femenino, tan solamente dos favorecieron las niñas en función del modelo de análisis aquí utilizado, los cuales son, la nariz y detalles del ojo con cejas y pestañas. En relación a los siete ítems que Goodenough ha observado como característicos del sexo masculino, ningún de ellos fue constatado por el análisis hecho en este estudio. Una posible interpretación para eso es que las diferencias pueden estar en función del tipo de análisis e instrumento usados, así como también que algunos de los ítems observados no forman parte de su escala final para la evaluación cognitiva.

 

Conclusiones

Los tests psicológicos son parte fundamental de los procesos de evaluación que implican toma de decisiones y que establecen diferencias entre grupos. Si los ítems de un test presentan problemas de DIF, los puntajes para los grupos involucrados no son comparables y, por lo tanto, ellos no pueden ser interpretados de igual modo. La posible falta de equidad de los instrumentos de medida ha convertido los estudios de DIF en parte esencial en la construcción de tests y de sus reevaluaciones.

Este estudio no tuvo el objetivo de identificar las causas del DIF, sino más bien verificar su existencia entre 46 detalles, según el sistema de Goodenough, usados como criterio para evaluar el DFH. Se trató de una investigación para detectar el DIF, o sea, determinar una posible diferencia entre las conductas de los ítems, comparando dos grupos.

Muñiz (1997) ya ha dicho que es posible afirmar que no hay ítems completamente sin sesgos. Así que el problema seria saber cual es la cantidad tolerable de sesgo en un test. De hecho, casi la mitad de los ítems examinados de los criterios de Goodenough presentaron DIF, lo que puede ser calificado como alto. Ese resultado puede ser considerado como un indicativo de invalidez del test, pues dificultaría la interpretación de los resultados; seria muy difícil saber si un puntaje de un niño está rebajado porque él ha dibujado un detalle más característico de las niñas en detrimento de otro más peculiar a los niños.

Así, de los resultados encontrados parece desprenderse la hipótesis de que algún tipo de factor relacionado con el sexo de los sujetos puede estar influyendo en la forma como ellos dibujan una persona. Por eso, a lo mejor se deba considerar seriamente la posibilidad de intentar construir escalas diferenciadas para cada uno de los sexos, con ítems característicos de cada sexo. Tal vez si se hicieran escalas que consideren ese hecho el DFH, según el sistema de Goodenough, ofrezca evidencias de validez más consistentes. No se debe dejar de tener en consideración que ese sistema es el que mejor se correlaciona con otros tests de inteligencia y desempeño académico (Scott, 1981).

Aunque sea difícil que el DFH ofrezca psicométricamente condiciones similares a otros tests de inteligencia, no se puede dejar de lado el hecho de que es un instrumento que posibilita una evaluación rápida, no es invasor y que facilita su administración en personas con problemas de varias naturalezas. En total, su utilidad como screening no debe ser descartada, pues parece ser muy adecuado para determinadas situaciones. En ese sentido, la intención de profundizar los análisis de ese instrumento deberían ser retomados, pues parece que las críticas planteadas a él es posible que sean planteadas para otros tests de inteligencia, como aquellos que presentan una gran cantidad de varianza no explicada cuando se correlacionan con otros tests de inteligencia y bajas correlaciones con el desempeño académico.

Un hecho que quizá también deba ser mejor analizado en el DFH se refiere a no captar inteligencias más altas (Scott, 1981). No obstante, mismo que se confirme su poca discriminación para personas con ese nivel, los tests no tienen ni estiman la inteligencia en un gran rango y lo que es alta inteligencia en algunos tests no suele ser en otros.

Es posible concebir que las diferencias observadas en la conducta de un ítem en personas de distintos grupos se pueden deber no a una validez diferencial del instrumento para los distintos grupos sino más bien a la diferente precisión con la que se han estimado los parámetros en uno y otro grupo. Pese a eso, lo más frecuente es que la pertenencia a un grupo determinado puede enmascarar variables de gran significación para el constructo pretendidamente evaluado (Muñiz, 1997). A ese respecto, Goodenough (1926) ya había apuntado para detalles que serian característicos del sexo masculino y otros del sexo femenino. Comparando los ítems hallados por ella y en esta investigación se ha observado que muy pocos fueron los mismos. De ese modo, pese a la diferencia de procedimientos para detectar cuales serían más característicos de un grupo u otro, hay algo que necesita más investigación para una mejor comprensión de lo que significan esos sesgos hallados. A la vista de los resultados, a lo mejor convendría hacer más investigaciones para entender mejor ese test y, si posible, realizar inferencias más fidedignas y válidas a partir de él.

 

Referencias

Abell, S. C., Von Briesen, P. D., & Watz, L. S. (1996). Intellectual evaluations of children using human figure drawings: An empirical investigation of two methods. Journal of Clinical Psychology, 52(1), 6774.         [ Links ]

Aguerri, M. E., Galibert, M. S., Zanelli M. L., & Attorresi, H. F. (2005). Detección errónea del funcionamiento diferencial del ítem. Una comparación de métodos. Psicothema, 17 (2), 350-355.         [ Links ]

Aguerri, M. E., Zanelli M. L., & Galibert, M. S. (2002). Evaluación de un método empírico para detectar el funcionamiento diferencial del item. Interdisciplinaria, 19 (2),185-213.         [ Links ]

Aikman, K. G., Belter, R. W., & Finch, A. J. (1992). Human figure drawings: Validity in assessing intellectual level and academic achievement. Journal of Clinical Psychology, 48(1), 114120.         [ Links ]

Almeida, R. M. (1959). Um estudo do status mental em um grupo de crianças nordestinas em idade escolar. Boletim de Psicologia, 11 (38), 35-55.         [ Links ]

Alves, I. C. B. (1981). O teste Goodenough-Harris em pré-escolares paulistanos. Boletim de Psicologia, 80, 33, 40-52.         [ Links ]

Antipoff, H. (1931). O desenvolvimento mental da criança de Bello Horizonte. Revista da Educação e Saúde Pública, 17, 17-27.         [ Links ]

Bandeira, D. R, & Hutz, C. S. (1994). A contribuição dos testes DFH, Bender e Raven na predição do rendimento escolar na primeira série. Psicologia: Teoria e Prática, 10, 1, 59-72.         [ Links ]

Bardos, A. N. (1993). Human figure drawings: Abusing the abused. School Psychology Quarterly, 8(3), 177181.         [ Links ]

Barros, M. C., & Ison, M. S. (2002). Conductas problemas infantiles: indicadores evolutivos y emocionales em el dibujo de la figura humana. Revista Interamericana de Psicología, 36(1-2), 289-298.         [ Links ]

Benito. J. G., & Ara, M. J. N. (1998). Impacto y funcionamiento diferencial de los ítems respecto al género en una prueba de aptitud numérica. Psicothema, 10(3), 685-696.         [ Links ]

Binet A., & Simon T. (1916). The Development of Intelligence in Children. Transl. ES Kite. Baltimore: Williams Wilkins         [ Links ]

Brown, W. R., & McGuire, J. M. (1976) Current psychological assessment practices. Professional Psychology, 7(4), 475-484.         [ Links ]

Carvalho, M. M. M. J. (1960). O desenho da figura humana como medida de inteligência e diagnóstico da personalidade em débeis mentais. Boletim no.251, Psicologia, 8, 29-44.         [ Links ]

Draba, R. E. (1977). The identification and interpretation of item bias. Rasch Measurement Transactions, MESA Memorandum no. 25. Recuperado em 13 de abril de 2004, de http://www.rasch.org/rmt/rmt122m.htm.         [ Links ]

Fidalgo, A. M., Mellenbergh, G. J., & Muñiz, J. (1998). Comparación del procedimiento Mantel-Haenszel frente a los modelos loglineales en la detección del funcionamiento diferencial de los ítems. Psicothema, 10(1), 209-218.         [ Links ]

Fidalgo, A.M. (1996). Funcionamiento diferencial de los items. In J. Muñiz (Ed.), Psicometría (pp. 371-455). Madrid, Spain: Universitas.         [ Links ]

Galibert, M. S., Aguerri, M. E., & Attorressi, H. F. (2000). Pesos óptimos de los items en la elaboración de los puntajes. Revista Latinoamericana de Psicología, 32(2), 79-90.         [ Links ]

Goh, D. S., Teslow, J., & Fuller, G. B. (1981). The practice of psychological assessment among school psychologists. Professional Psychology, 12(6), 696-706.         [ Links ]

Gómez, J., & Hidalgo, M. D. (1997). Evaluación del funcionamiento diferencial en ítems dicotómicos: Una revisión metodológica. Anuario de Psicología, 74, 3-32.         [ Links ]

Goodenough, F. L. (1926). Measurement of intelligence by drawings. World Book Company, The House of Applied Knowledge, New York.         [ Links ]

Gresham, F. M. (1993). "What's Wrong in This Picture?": Response to Motta et al.'s Review of Human Figure Drawings. School Psychology Quarterly, 8 (3), 182-86.         [ Links ]

Harris, D. B. (1991). El test de Goodenough. Revisión, ampliación y actualización. Espanha: Ediciones Paidós.         [ Links ]

Hutz, C. S., & Antoniazzi, A. S. (1995). O desenvolvimento do desenho da figura humana em crianças de 5 a 15 anos de idade: normas para sua avaliação. Psicologia: Reflexão e Crítica, 8(1), 3-18.         [ Links ]

Kamphaus, R. W., & Pleiss, K. L. (1991). DrawAPerson techniques: Tests in search of a construct. Journal of School Psychology, 29(4), 395401.         [ Links ]

Koppitz, E. M. (1968). El dibujo de la figura humana en los niños. Buenos Aires: Editorial Guadalupe.         [ Links ]

Louttit, C. M., & Browne, C. G. (1947). The use of psychometric instruments in psychological clinics. Journal of Consulting Psychology, 11, 49-54.         [ Links ]

Marañón, P. P., García, B. M. I., & Costas, C. S. L. (1999). Detección del funcionamiento diferencial de los ítems en una prueba de ciencias. Psicothema, 11(3), 691-697.         [ Links ]

Millsap, R. E., & Everson, H. T. (1993). Methodology Review: Statistical Approaches for Assessing Measurement Bias. Applied Psychological Measurement, 17 (4), 297-334.         [ Links ]

Motta, R. W., Little, S. G., & Tobin, M. I. (1993a). The use and abuse of human figure drawings. School Psychology Quarterly, 8 (3), 162169.         [ Links ]

Motta, R. W., Little, S. G., & Tobin, M. I. (1993b). A picture is worth less than a thousand words: Response to reviewers. School Psychology Quarterly, 8(3), 197199.         [ Links ]

Muñiz, J. (1997). Introducción a la teoría de respuesta a los items. Madrid: Psicología         [ Links ]

Naglieri, J. A. (1988). Draw a Person: A quantitative scoring system. Manual. The Psychological Corporation Harcourt Brace Jovanovich, Inc. Pirámide.         [ Links ]

Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests. Copenhagen: Nielson & Lydiche.         [ Links ]

Scott, L. H. (1981) Measuring intelligence with the Goodenough-Harris Drawing Test. Psychological Bulletin, 89, 1, 483-505.         [ Links ]

Sinha, M. (1970). A study of the Harris Revision of the Goodenough Draw-a-Man test. British Journal of Educational Psychology, 40, 221-222.         [ Links ]

Sisto F. F. (2005). O Desenho da Figura Humana - Escala Sisto. Vetor Editora Psicopedagógica Ltda.         [ Links ]

Sisto, F. F. (2000). Relationships of the Piagetian Cognitive development to Human Figure Drawing. Journal of School Psychology, 30 (4), 432 - 441.         [ Links ]

Van Kolck, O. L. (1981). Técnicas de exame psicológico e suas aplicações no Brasil. Petrópolis: Vozes.         [ Links ]

White, T.H. (1979). Correlations among the WISCR, PIAT, and DAM. Psychology in the Schools, 16(4), 497501.         [ Links ]

Wright, B. D., Mead R., & Draba R. (1976). Detecting and correcting test Iten Bias with la Logistic Response Model. MESA Research Memorandum, no. 22. Mesa Psychometric Laboratory. Recuperado em 12 de abril de 2004, de http://www.rasch.org/rmt/rmt122m.htm.         [ Links ]

Wright, B.D., & Linacre, J.M. (1998). WINSTEPS: A Rasch computer program. Chicago: MESA Press.         [ Links ]

Wright, B.D., & Panchapakesan, N. (1969). A procedure for sample-free item analysis. Educational and Psychological Measurement, 29, 23-37.        [ Links ]

 

 

Received 25/07/2006
Accepted 21 /11/2006

 

 

Fermino Fernandes Sisto é doutor pela Universidad Complutense de Madrid, Livre - docente pela Unicamp e docente do curso de Psicologia e do Programa de Estudos Pós-graduados em Psicologia, da Universidade São Francisco, campus Itatiba-SP. Bolsista produtividade do CNPq.
1 Dirección: Rua Carlos Guimarães, 150 ap 82, 13024-200, Cambui, Campinas, São Paulo, Brasil. E-mail: fermino.sisto@gmail.com