Serviços Personalizados
Journal
artigo
Indicadores
Compartilhar
Avaliação Psicológica
versão impressa ISSN 1677-0471
Aval. psicol. vol.9 no.2 Porto Alegre ago. 2010
Tradução e validação para a língua portuguesa das escalas de presentismo WLQ-8 e SPS-6
Validation into portuguese language of presenteeism scales WLQ-8 and SPS-6
Aristides Isidoro Ferreira1,I; Luís Fructuoso MartinezII; Luís Manuel SousaIII; João Vieira da CunhaIV
IUniversidade Lusíada de Lisboa
IIInstituto Superior de Ciências do Trabalho e da Empresa Instituto Universitário de Lisboa
IIIHospital Curry Cabral, Universidade Atlântica e Universidade Católica Portuguesa
IVFaculdade de Economia da Universidade Nova de Lisboa
Resumo
Este estudo teve como objectivo a validação para a língua Portuguesa de duas escalas de presentismo e apresentar as características métricas das versões reduzidas do Work Limitations Questionnaire (WLQ) e da Stanford Presenteeism Scale (SPS-6). Tratando-se de instrumentos desenvolvidos para avaliar o presentismo: um fenômeno frequente nas organizações que consiste no facto de as pessoas estarem presentes no local de trabalho mas, devido a problemas físicos ou psicológicos, não conseguirem cumprir as suas funções na totalidade. Participaram no nosso estudo trabalhadores Portugueses pertencentes aos sectores da saúde, ensino e banca (n = 305). Através da realização de análises de componentes principais com rotação varimax, análises factoriais confirmatórias, estudos de concomitância e teoria de resposta ao item, foram demonstradas as boas qualidades métricas de ambas as escalas. Desta forma, sugere-se a aplicação destes instrumentos em contexto organizacional, com vista a detectar padrões de inactividade dos recursos humanos associados ao presentismo.
Palavras-chave: Validação; Psicometria; TRI; Produtividade; Recursos Humanos.
Abstract
This study aimed to validate two presenteeism scales to the Portuguese language and present the metrical properties of the short versions, in Portuguese, of the Work Limitations Questionnaire (WLQ) and the Stanford Presenteeism Scale (SPS-6). These instruments were designed to measure presenteeism: an emerging concept in organizations that consists of workers being on the job but, due to physical or psychological disorders, not be fully functioning. Portuguese workers from health, education and bank sectors (n = 305) participated in our study. By conducting principal component analysis with varimax rotation, confirmatory factor analysis, concomitance studies and item response theory, the appropriate metrical qualities of both scales were demonstrated. Thus, we suggest the application of these instruments in organizational context, in order to detect patterns of inactivity related to presenteeism.
Keywords: Validation, Psychometrics, IRT, Productivity, Human Resources.
Introdução
Estar [fisicamente] no local de trabalho mas, devido a doença ou outra condição médica, ser incapaz de produzir em pleno (Hemp, 2004, p. 1). Esta frase ilustra um fenómeno em crescimento na literatura organizacional, designado por presentismo. Apesar de retratar uma realidade há muito existente, o conceito só saltou para ribalta pela mão de Paul Hemp, que, em 2004, redigiu um artigo seminal sobre o tema na prestigiada revista Harvard Business Review. A pertinência do estudo deste constructo prende-se com as manifestas perdas de produtividade associadas as pessoas afectadas pelo presentismo no seu posto de trabalho. A priori, a atenção dos gestores e dos departamentos de Recursos Humanos tem recaído sobre o absentismo (i.e., faltas ao trabalho), dado que este conceito é, evidentemente, mais fácil de medir (Sousa, 2005).
Um dos axiomas básicos da linguagem organizacional refere que, para produzir, os trabalhadores devem estar presentes no seu local de trabalho. Investigações recentes em torno desta temática revelam-nos que essa afirmação está longe de corresponder à verdade. Um estudo realizado por Ozminkowski, Goetzel e Long (2003) mostrou que, apesar de estarem presentes no seu local de trabalho, alguns trabalhadores apresentaram índices de produtividade indesejáveis, devido a problemas variados que se inscrevem nos domínios do psicológico e fisiológico. Nos Estados Unidos da América, uma fundação estatal revelou que 60% dos trabalhadores deslocam-se ao local de trabalho, apesar de padecerem de problemas de saúde diversificados (Ozminkowski et al., 2003). Algumas dessas razões parecem ter sido encontradas num trabalho conduzido por McKevitt, Morgan, Dundas e Holland (1997), que revela que 48% dos indivíduos sentem-se culpados por faltar ao trabalho, 20% receiam uma atitude hostil das chefias e 18% temem as consequências nefastas da perda de produtividade no trabalho.
Num cenário de avaliação económica das perdas de produtividade, deverá ter-se em consideração tanto os custos directos como os custos indirectos. Os custos directos mais fáceis de medir estão relacionados com as consultas médicas, as hospitalizações, os gastos com medicação, bem como o tempo de contacto entre utentes e prestadores de cuidados. Por outro lado, os custos indirectos mais difíceis de medir são avaliados através do absentismo e do presentismo. Este último conceito, sobre o qual nos debruçamos, é ainda mais difícil de contabilizar, pois prende-se com a redução da produtividade durante o trabalho (Prasad, Wahlqvist, Shikiar, & Shih, 2004). Estima-se que, nos Estados Unidos, as perdas anuais de produtividade relacionadas com problemas de saúde representam aproximadamente 260 mil milhões de dólares, atribuídas não só ao absentismo como também ao presentismo ou seja, quando o colaborador está presente no local de trabalho, mas com redução das suas capacidades (Mattke, Balakrishnan, Bergamo, & Newberry, 2007).
Entre as principais causas de presentismo, incluem-se vários tipos de perturbações, tanto a nível físico como a nível psicológico. Essas perturbações envolvem uma determinada condição médica, ou seja, o individuo está a sofrer de uma (ou mais) patologia(s) especifica(s) não se inclui a mera fuga ou escape ao trabalho. No campo físico, as doenças com maior prevalência são as de âmbito músculo-esquelético, tais como lombalgias (Prasad et al., 2004) e artrites (Allen, Hubbard & Sullivan, 2005), bem como cefaleias, dores crónicas e problemas respiratórios (Sousa, 2005). No campo psicológico, destacam-se ansiedade e depressão (Wang et al., 2003), stress (Goetzel, Ozminkowski & Long, 2003), bem como défice de atenção (Kessler et al., 2005). Estes sintomas inibem os colaboradores de dar o seu melhor, traduzindo-se em consideráveis (e nefastas) perdas de produtividade. O presentismo é uma realidade em todos os sectores de actividade, apesar da sua maior prevalência nos sectores da educação e da saúde (Aronsson, Gustafson, & Dallner, 2000).
Apesar do tema ser relativamente recente, existem já inúmeros instrumentos de medida de presentismo. Entre os mais utilizados, encontram-se os seleccionados para esta investigação: (1) Work Limitations Questionnaire (WLQ Lerner et al., 2001); e (2) Stanford Presenteeism Scale (SPS-6 Koopman et al., 2002). Estes instrumentos encontram-se validados para a língua inglesa. Estudos revelam que o WLQ apresenta um coeficiente de fiabilidade interna α Cronbach que varia entre 0.89 e 0.91 (Lerner et al., 2001; Lerner et al., 2002). Postesriormente, surgiram as suas versões reduzidas de 16 itens, com quatro dimensões e um α Cronbach que varia entre 0.74 e 0.96 (Beaton & Kennedy, 2005) e de 8 itens (Ozminkowski, Goetzel, Chang & Long, 2004). O WLQ, na versão 25 itens, foi validado em português do Brasil, com a Cronbach que varia entre 0.81 a 0.90 nos quarto domínios (Soarez, Kowalski, Ferraz, & Ciconelli, 2007). Contudo, em Portugal, não existem estudos psicométricos do WLQ. Os primeiros trabalhos de tradução da SPS-6 para a língua portuguesa (Martinez, Ferreira, Sousa, & Cunha, 2007), demonstraram a existência de dois factores independentes (trabalho completado e distracção evitada) e um valor do a de Cronbach de 0.78 e 0.74, respectivamente.
Neste estudo, temos como objectivo testar junto da população Portuguesa as propriedades de medida da versão (em língua Portuguesa) das escalas simplificadas mais utilizadas para medir o presentismo (Stanford Presenteeism Scale-6 e Work Limitations Questionnaire-8). Desta forma, estes instrumentos poderão futuramente ser utilizados para diagnosticar este fenómeno em contexto organizacional e, consequentemente, estimar o impacto de doenças sobre a produtividade de trabalhadores portugueses. Recorrendo à teoria clássica dos testes (TCT) bem como à teoria de resposta ao item (TRI), pretende-se, com este trabalho, aprofundar o estudo das características psicométricas de novas versões traduzidas relativas a duas das mais importantes escalas de presentismo referidas pela literatura. Neste sentido, com recurso à TCT e TRI, procuraremos identificar características psicométricas ao nível da precisão interna, validade de constructo e validade concomitante na correlação entre estas duas escalas de presentismo.
Método
Participantes
Este estudo integra um conjunto de 305 trabalhadores de nacionalidade Portuguesa, dos quais 209 são provenientes dos sectores do ensino e da saúde (duas universidades e dois centros de saúde) e 96 do sector bancário. As empresas em causa pertencem todas à região de Lisboa (Portugal). A média de idades é de 35.77 anos (DP=10.86; Min.=18, Max.=66), sendo que 221 participantes (72.5%) pertencem ao sexo feminino.
Instrumentos
Work Limitations Questionnaire Reduced Form(WLQ-8 Ozminkowski et al., 2004).
A versão reduzida que iremos apresentar neste estudo baseia-se na forma standard do Work Limitations Questionnaire, constituído inicialmente por 25 itens que avaliam quatro dimensões: i) gestão do tempo; ii) capacidade para realizar o trabalho físico; iii) concentração e relacionamento interpessoal; e iv) capacidade para atingir objectivos (Lerner et al., 2001). A versão reduzida foi mais tarde adoptada por Ozminkowski e cols (2004) e apresenta somente oito itens auto-reportados e ancorados numa escala de 5 pontos (discordo totalmente até concordo totalmente). Do ponto de vista da validade, surge como uma boa medida para avaliar o impacto das doenças crónicas em contexto de trabalho. De igual forma, fornece uma imagem adequada do papel da saúde do trabalhador na produtividade do trabalho (Lerner et al., 2001). De referir também que os índices de consistência interna apresentam valores bastante aceitáveis acima de .90 (Lerner et al., 2001).
Stanford Presenteeism Scale-6(SPS-6 Koopman et al., 2002).
Trata-se de uma medida que avalia as perdas de produtividade laboral através de dois factores distintos: trabalho completado e distracção evitada. O primeiro factor incide nas causas físicas de presentismo e corresponde à quantidade de trabalho realizado sob efeito das causas de presentismo. O segundo factor prende-se com aspectos psicológicos e corresponde à quantidade de concentração mobilizada para produzir quando existe um efeito de presentismo. Cada um destes factores é avaliado por três itens, o que totaliza seis questões ancoradas numa escala com cinco modalidades de resposta (discordo totalmente até concordo totalmente). Do ponto de vista das propriedades psicométricas, os factores da escala apresentam valores do alpha de Cronbach acima de .80 e validade preditiva sugerindo correlações significativas com dimensões de produtividade organizacional (Lofland et al., 2004).
Procedimento
Tratando-se de um estudo de validação de dois instrumentos para a língua portuguesa, seguiram-se os procedimentos de tradução e retroversão das versões originais em língua inglesa para a língua portuguesa (tal como sugerido por Streiner & Norman, 1995). Os itens da versão inglesa foram traduzidos por dois psicólogos com boa fluência em Inglês. De seguida, procedeu-se à retroversão para a língua inglesa, trabalho efectuado por uma profissional bilingue (Inglês e Português). Os itens foram comparados entre si, tendo sido reformulados aqueles que não correspondiam de todo à tradução. De seguida, efectuou-se uma reflexão falada dos itens junto de 26 enfermeiros e médicos de um hospital público da região de Lisboa (Portugal), com o objectivo de analisar eventuais dificuldades de compreensão e de interpretação associadas a aspectos culturais inerentes ao conteúdo e forma das afirmações. Dos resultados destes estudos prévios, não foram retiradas quaisquer ilações que justificassem uma alteração dos itens do questionário.
As instituições que aceitaram participar no estudo (bem como os seus trabalhadores) foram previamente informados acerca dos objectivos da investigação. Os colaboradores preencheram os questionários no seu local de trabalho. Depois de preenchidos, estes foram devolvidos aos investigadores que se prontificaram a esclarecer algumas questões e a recolher os questionários. De seguida, os dados foram analisados, tendo sido eliminados 7% dos questionários em virtude de apresentarem omissões ou lacunas no preenchimento.
Resultados
O presente trabalho tem como objectivo a análise das qualidades psicométricas de duas das escalas tipicamente utilizadas para avaliar o presentismo (WLQ-8 e SPS-6). Começaremos pela análise descritiva dos itens que integram cada um dos questionários em estudo (Tabela 1).
Dado que ambas as escalas possuem a mesma métrica, os valores médios dos scores individuais dos itens são muito semelhantes. Utilizando o software estatístico SPSS 17.0, verificamos que o registo mais elevado do WLQ surge associado ao primeiro item (WLQ1), enquanto que na SPS-6 aparece no segundo item (SPS2). Em contrapartida, os valores mais baixos surgem no item 3 do WLQ e no item 4 da SPS-6. Os valores de desvio-padrão da SPS-6 revelam valores ligeiramente superiores àqueles obtidos junto dos oito itens do WLQ.
No que diz respeito às intercorrelações dos itens do WLQ, é possível descrever um conjunto de correlações significativas (p<.001) entre todos os itens, sendo que as correlações mais baixas surgiram entre os itens 4 e 8 (r=.351, p<.01) e entre os itens 1 e 8 (r=.398, p<.01). Por seu lado, as correlações mais elevadas verificaram-se entre os itens 5 e 6 (r=.741, p<.01) e entre os itens 6 e 7 (r=.724, p<.01). Estas fortes associações deixam a supor a existência de uma grande variância comum a todos estes itens.
Pelo contrário, ao nível da SPS-6 encontraram-se somente correlações significativas entre alguns itens, destacando-se as fortes correlações entre o item 3 e 4 (r=.629, p<.01). Por outro lado, alguns itens partilham pouca variância entre si, como é o caso dos itens 1 e 2 (r=-.033, ns) e os itens 2 e 3 (r=-.065, ns). Ao contrário da situação verificada no WLQ, esta situação deixa antever uma variância dispersa entre os seis itens da SPS-6.
Para estudar o comportamento dos itens das duas escalas, desenvolvemos duas análises de componentes principais e rotação ortogonal do tipo Varimax. Previamente, foram testados os pressupostos de normalidade através das medidas de assimetria e curtose. Os dados sugerem para todos os itens, valores de normalidade não severos (Skewness<2; Kurtosis<7; West, Finch, & Curran, 1995). As medidas de adequação da amostra de Kaiser-Meyer-Olkin (KMO=.901 para WLQ e KMO=.738 para SPS-6) e os testes de esfericidade de Bartlett (χ2(28)=4,733, p<.001 para WLQ e χ2(15)=581,550, p<.001 para SPS-6) mostraram uma adequação dos dados para a presente amostra. Estudos de simulação indicam que a correlação parcial média (CPM) é o melhor método para avaliar a dimensionalidade dos dados da matriz (Zwick & Velicer, 1986). De igual forma, recorreu-se ao método robusto dos mínimos ponderados (Velicer, Eaton, & Fava, 2000) e formas paralelas (Horn, 1965) para estimar o número de factores das escalas. Utilizando os procedimentos sugeridos por OConnor (2000), obtemos no WLQ um único factor com 59.16% da variância da escala. A SPS-6 permitiu a identificação de dois factores com 39.08% e 31.40%, que totalizam 70.48% da variância. A plausibilidade destes factores é ainda assegurada pelo facto dos loadings apresentarem correlações superiores a .60 para todos os itens das duas escalas. Fazendo a leitura dos itens que integram cada uma das duas escalas, designamos o factor único da WLQ Limitações no Trabalho. Seguindo as orientações que estiveram na base de construção da SPS-6, denominamos o primeiro factor Distracção Evitada e o segundo factor Trabalho Completado.
As correlações entre itens e a dimensão global da escala sugerem um contributo do item na avaliação do comportamento que está a ser medido (Anastasi & Urbina, 2000). Wolfe e Smith Jr. (2007) recomendam valores acima de .40 para escalas com estas características. Neste caso, o valor mais baixo situa-se em .440 na correlação entre SPS2 e a dimensão global do factor 2. Uma análise atenta destes resultados permite-nos constatar que os itens das duas escalas de presentismo são relevantes e dão um contributo importante para as dimensões avaliadas. Por outro lado, as correlações ainda algo distantes da unidade retiram alguma redundância do item para as dimensões avaliadas.
Ainda de acordo com a Tabela 2, é possível encontrar valores de consistência interna de .897 para a dimensão global de limitações no trabalho. No que diz respeito aos itens que integram cada um dos factores da SPS-6, verificam-se índices de consistência interna de .815 (Factor 1) e .780 (Factor 2). Tratando-se de uma análise do alpha de Cronbach, o número de itens é um factor a ter em consideração (Cortina, 1993). Neste caso, as dimensões avaliadas apresentam poucos itens, pelo que podemos considerar os alphas obtidos como sendo adequados para as medidas em estudo.
De acordo com alguns autores (Fabrigar, Wegner, MacCallum, & Strahan, 1999; Thompson, 2004), os dados obtidos na análise de componentes principais podem ser devidamente confirmados numa posterior análise factorial confirmatória. Para esse efeito, desenvolveu-se uma análise factorial confirmatória com recurso ao software AMOS 6.0 (Arbuckle, 2005). Tal como referido atrás, efectuámos um conjunto de análises que atestaram os pressupostos de normalização das medidas. Este procedimento permitiu a utilização do método robusto de estimação em Máxima Verosimilhança. Neste sentido, a literatura (Hoyle & Panter, 1995) parece enfatizar o facto de este último tolerar bem amostras com tamanhos mais reduzidos e funcionar adequadamente com dados numa escala intervalar. A interpretação dos resultados obtidos foi efectuada por intermédio de alguns índices de ajustamento sugeridos por MacCallum e Austin (2000): Qui- Quadrado, GFI (Goodness-of-Fit Index), CFI (Comparative Fit Index), IFI (Incremental Fit Index), TLI (Tucker-Lewis Index) e RMSEA (Root Mean Squared Error of Approximation). Para Macmann e Barnett (1994), no Qui-Quadrado quanto menor for o seu valor, melhor é o ajustamento, sendo desejável uma maior aproximação aos graus de liberdade (df) e consequente aceitação da hipótese nula (p>.05). No CFI e IFI, um valor superior a .90 representa um bom ajustamento e no GFI e TLI o ajustamento do modelo remete para valores superiores a .95 (Hu & Bentler, 1995). Por sua vez, no RMSEA consideram-se os valores inferiores a .08 como sendo devidamente adequados (Hancock & Freeman, 2001). De alguma forma, procurámos modelar e confirmar os modelos obtidos na análise de componentes principais. Os modelos post-hoc justificaram uma maximização do ajustamento dos modelos com a covariação dos resíduos de alguns itens com conteúdos semelhantes no WLQ e na dimensão Trabalho Completado da SPS-6. Os valores obtidos revelaram um ajustamento dos modelos testados no WLQ a um factor denominado Limitações no Trabalho (χ2(15)=28.23, p=.020; GFI=.976; CFI=.990; IFI=.990; TLI=.980; RMSEA=.055) e, na SPS-6, a dois factores denominados Distracção Evitada e Trabalho Completado (χ2(6)=8.97; GFI=.990; CFI=.995; IFI=.995; TLI=.987; RMSEA=.041). De referir que os coeficientes de regressão obtidos apresentam valores significativos de p<.01 para todos os itens, como excepção de SPS2 que apresenta um valor significativo de p<.05. O valor de covariação negativo (e significativo para p<.01) entre Distracção Evitada e Trabalho Completado mostra duas dimensões contrárias de presentismo avaliadas pelo SPS-6.
No sentido de aferir estudos de concomitância, efectuámos correlações de Pearson entre as duas sub-escalas da SPS-6 e a dimensão global da escala de Limitações no Trabalho. Os resultados, presentes na Tabela 3, mostram as estatísticas descritivas e as correlações entre os valores médios dos itens que integram as sub-escalas. Nesse particular, destacamos as correlações positivas e significativas entre a escala de Limitações no Trabalho e a sub-escala Trabalho Completado (r=.390, p<.001). Em contrapartida, a sub-escala Distracção Evitada apresenta correlações negativas com a sub-escala Trabalho Completado (r=-243, p<.001) e Limitações no Trabalho (r=-364, p<.001). Estas evidências sugerem uma complementaridade entre escalas e reforçam o facto de Distracção Evitada avaliar uma dimensão de presentismo contrária à das restantes dimensões estudadas. Neste sentido, parece-nos evidente que, contrariamente às dimensões de Limitações no Trabalho e Trabalho Completado, quanto maior o score em Distracção Evitada, menores as evidências de presentismo.
Para além da validação das escalas com recurso à teoria clássica dos testes, recorreu-se adicionalmente à teoria de resposta ao item e utilização do software estatístico Winsteps. Para o efeito, utilizou-se o modelo de Rasch para itens politómicos que coloca os dados dos sujeitos e itens dentro de um mesmo contínuo (Prieto & Delgado, 2003). Existindo vários modelos associados à teoria de resposta ao item, optámos neste caso pelo modelo logístico a um parâmetro (que integra a grande família dos modelos de Rasch), tendo em vista as diferenças entre o desempenho dos sujeitos e a dificuldade dos itens:
O indicador para verificar o ajustamento dos dados e das características do modelo são as medidas de Infit e Outfit. Infit corresponde à média dos resíduos ponderados com a sua variância e, de acordo com Linacre (2000), um valor ajustado situa-se entre -.5 e 1.5. Outfit refere-se à média dos resíduos padronizados ao quadro, o que reflecte a diferença entre os valores observados e esperados pelos modelos testados nos oito itens que integram a dimensão global da WLQ e dos três itens das dimensões Distracção Evitada e Trabalho Completado da SPS-6. Neste caso, Wright e Linacre (1998) argumentam que valores superiores a 1.5 indicam desajuste moderado a alto e acima de 2.00 valores proibitivos que tendencialmente degradam e prejudicam gravemente a medida. De referir ainda que este último valor é bastante sensível aos outliers e respectivos valores extremos (Prieto & Velasco, 2006).
Na tabela 4, encontram-se os valores médios de Infit e Outfit das duas dimensões de presentismo da SPS-6 e do factor Limitações no Trabalho obtido pelo WLQ. De acordo com os critérios descritos por Linacre (2000) e Wright e Linacre (1998), verificamos um ajustamento adequado das medidas em todas as dimensões avaliadas. Uma análise dos itens que integram o WLQ e o SPS-6 permite-nos constatar que o maior desajuste surge no SPS2, com um valor de Infit de 1.25 e Outfit de 1.28. Apesar de tudo, estes valores encontram-se ainda abaixo do limiar estabelecido pela literatura, o que pressupõe um ajustamento dos mesmos para a avaliação das dimensões de presentismo consideradas nas duas escalas.
De referir, ainda, algum desfasamento entre a média de Rasch para os sujeitos e itens. No caso de Distracção Evitada, os sujeitos tendencialmente optam pelas categorias inferiores da escala (e.g., Discordo totalmente, Discordo). Pelo contrário, nas Trabalho Completado e Limitações no Trabalho as opções recaem sobretudo nas categorias superiores (e.g., Concordo, Concordo totalmente). Apesar da proximidade do factor Distracção Evitada com o zero, verificamos uma tendência de desequilíbrio nas respostas dos sujeitos ao longo das diferentes categorias da medida.
Através do Winsteps é ainda possível identificar um dos principais pressupostos de validade, normalmente associado à ausência de viés das medidas (Sisto, Bartholomeu, Santos, Rueda, & Suehiro, 2008). Os viés (ou enviesamentos) reportam-se a um conjunto de erros que deturpam a validade dos constructos no que diz respeito à sua avaliação entre grupos de proveniências diversas (Aliste, 1996). A análise de funcionamento diferencial dos itens (DIF) é uma importante fonte para comprovar que um teste é válido (Camilli, 2006). Assume que a probabilidade de responder correctamente a um item depende somente das diferenças do constructo, determinadas pela capacidade do sujeito e pela dificuldade do item, independentemente do grupo de pertença (sexo, cultura, língua, etc...). Uma vez que a variável sexo foi incluída neste estudo e assume-se como uma das variáveis mais estudadas nos estudos de DIF (vide, Prieto & Delgado, 2003; Sisto et al., 2008), procuraremos analisar se a probabilidade de escolha ou modalidade de resposta num item apresenta diferenças entre indivíduos de sexo diferente, mas cuja medida de Rasch para os sujeitos se situe num mesmo patamar de dificuldade (Aliste, 1996).
Para análise do funcionamento DIF dos itens, utilizámos a metodologia desenvolvida por Wright e Stone (1979) para comparação das estimações dos parâmetros de dificuldade dos itens. Controlando o nível de dificuldade dos atributos avaliados é esperado que não existam diferenças de funcionamento dos itens para variáveis externas como o género (Aliste, 1996). Neste sentido, é esperado que a probabilidade dos elementos dos sexo masculino e feminino responderem a uma categoria do item não seja diferente quando se encontram num mesmo nível do constructo. Tal como indicado na fórmula, através de um procedimento t-test, conseguimos estimar os parâmetros de dificuldade do item e os erros standardizados das estimativas, contrastando os resultados do sexo masculino (categoria 1 na fórmula) com o sexo feminino (categoria 2 na fórmula):
Apesar da fórmula atribuir 1 ao sexo masculino e 2 ao feminino, iremos referenciar sempre 0 como pertencente ao sexo masculino e 1 ao sexo feminino. Desta forma, começaremos pela análise dos outputs para o WLQ. Os dados mostram diferenças significativas apenas para o item WLQ3 [t(271)= -2.70, p=.007]. O nível de dificuldade do item é significativamente inferior nos homens (δ?=.40, SE=.04) do que nas mulheres (δ?=.90, SE=.06). Através da análise das Figuras 1 e 2, encontramos uma maior desfasamento (δ?-δ?=-.50) junto do item WLQ3. De acordo com Paek (2002; cit. por Smith, 2004) uma diferença situada entre .426 e .638 pode ser considerado um valor intermédio de DIF, pelo que apenas quando superior a .638 afecta gravemente a medida. Neste caso, situando-se o valor no intervalo .426 e .638 e existindo os restantes sete itens sem DIF, pensamos que a variável género não afecta a validade de constructo da medida Limitação no Trabalho.
No que diz respeito às duas dimensões de presentismo avaliadas pelo SPS-6, não foram encontrados itens com DIF para a dimensão Distracção Evitada. Pelo contrário, em Trabalho Completado encontrámos diferenças significativas junto do item SPS6 [t(253)= -.73, p<.001]. O nível de dificuldade do item é significativamente inferior nos homens (δ?=.27, SE=.08) do que nas mulheres (δ?=1.00, SE=.06). Tal como é possível observar nos gráficos 3 e 4, o terceiro item da dimensão Trabalho Completado (SPS6) apresenta a maior diferença de valores (δ?-δ?=-.73). Sendo manifestamente superior ao intervalo situado entre .426 e .638 sugerido por Paek (2002; cit por Smith, 2004), deduzimos que a variável género afecta a validade da medida. Tratando-se de uma sub-escala com somente três itens e existindo um deles com DIF, pensamos que algumas interpretações devem considerar o viés associado à variável género.
Discussão
O presente artigo tem por objectivo a tradução e validação de duas escalas de presentismo. Neste sentido, são apresentadas um conjunto de análises às propriedades psicométricas dos instrumentos. No que diz respeito à validade de constructo e ao WLQ em particular, é possível identificar uma única dimensão com 59.16% do total da variância da escala. Essa estrutura foi devidamente comprovada através de uma análise factorial confirmatória, que apresentou índices de ajustamento bastante satisfatórios. Neste sentido, não nos pareceu possível encontrar as quatro dimensões que normalmente surgem junto da versão standard do questionário a 25 itens (Lerner et al., 2001). A dimensão encontrada reporta o impacto das doenças crónicas em contexto laboral e tomou a designação de Limitações no Trabalho. A correlações entre os itens e o factor sugerem correlações manifestamente superiores a .40, pelo que de acordo com Wolfe e Smith Jr. (2007) asseguram o contributo dos itens para a dimensão global avaliada pela escala. Apesar de Lerner e colaboradores (2001) terem encontrado índices de consistência interna acima de .90, o valor obtido (alpha=.897) sugere, igualmente, uma boa precisão da medida.
A análise psicométrica da escala com recurso à teoria de resposta ao item atesta o ajustamento das medidas ao nível dos parâmetros de Infit e Outfit. Os valores próximos da unidade nos oito itens que integram a escala são um garante da validade dos itens e da sua adequação para avaliar o presentismo. Todavia, deve-se destacar o distanciamento da medida de Rasch para sujeitos (1.36) e itens (.00). Esse desfasamento indicia que os sujeitos de alguma forma tendem a responder às categorias mais elevadas de cada item. Tratando-se um questionário que adopta uma escala ancorada em cinco modalidades de resposta, sugere-se a modificação da escala, propondo uma possível ancoragem numa métrica de sete ou mais modalidades de resposta. De igual forma, numa futura investigação poderiam ser desenvolvidos novos itens para avaliação de níveis mais fáceis/ difíceis do constructo latente, promovendo uma maior amplitude na mensuração dos conceitos propostos. Ainda no âmbito da validade, testou-se um procedimento DIF tendo em vista a possível existência de viés associada à variável género. Neste sentido, foi possível verificar que o terceiro item (WLQ3) revela a existência de DIF, embora a um nível que deturpa moderadamente a medida em causa (Paek, 2002; citado por Smith, 2004).
No que diz respeito à SPS-6, a validade de constructo assegurou, primeiro nas análises de componentes principais e depois na análise factorial confirmatória, a existência de dois componentes distintos. Replicou-se, de alguma forma, a estrutura factorial de Koopman e cols (2002) e os respectivos factores de Trabalho Completado e Distracção Evitada. Estas duas dimensões avaliam as perdas de produtividade organizacional em função de sintomas físicos e psicológicos diversos. Tal como verificado no WLQ, também neste caso salvaguardamos os critérios de Wolfe e Smith Jr. (2007) e observamos correlações superiores a .40 entre os itens e os respectivos factores. A precisão das medidas é também assegurada pelo valores do alpha de Cronbach de .780 para a Trabalho Completado e .815 para Distracção Evitada. Estes valores aparecem um pouco na linha dos trabalhos de Lofland e cols (2004) e remetem para bons valores de consistência interna.
A análise da escala com recurso à teoria de resposta ao item permitiu identificar um item (SPS2) com maior desajuste (Infit 1.25, Outfit=1.28). Apesar de ser o item com pior ajuste, o valor ainda é algo inferior quando comparado com os valores limite estabelecidos pela literatura (Linacre, 2000; Wright & Linacre, 1998). Todavia, uma análise da Figura 2 mostra-nos que este item apresenta um coeficiente de regressão baixo com o factor Trabalho Completado (λ=.22). Para além disso, este é o item que apresenta uma correlação mais baixa com o factor avaliado (r=.440). Estes dados deixam antever um fraco contributo do item para a dimensão de Trabalho Completado, pelo que a sua inclusão na escala deve de alguma forma ser repensada. De referir que a análise de Rasch permitiu ainda identificar algum desfasamento entre a medida dos sujeitos (1.22) e a medida dos itens que integram a sub-escala Trabalho Completado. Na linha daquilo que referimos para o WLQ, pensamos que a inclusão de uma métrica maior poderá de alguma forma aproximar as medidas de Rasch para sujeitos e itens. Também a inclusão de novos itens permite avaliar outras características do constructo. No que concerne à sub-escala Distracção Evitada presenciamos uma maior proximidade entre a medida de Rasch para sujeitos e itens. Estes resultados deixam antever uma tendência dos sujeitos para escolher as categorias de resposta intermédias. Ainda neste caso os estudos de validade complementaram-se com a análise DIF aos itens que integram as duas sub-escalas de presentismo da SPS- 6. Sendo assim, apenas foi possível detectar viés associada ao género no item SPS6 da sub-escala Trabalho Completado. Pelas características do item, pensamos que a variável género afecta por si mesma as características da medida. Note-se ainda que a subescala Trabalho Completado se encontra consideravelmente associada às características físicas do presentismo. De alguma forma, estas variáveis físicas de presentismo (vide, Allen et al., 2005; Sousa, 2005) apresentam uma enorme variância no modo como afectam os resultados do trabalho entre homens e mulheres (Simpson, 1998). A forma como o item SPS6 está redigida de alguma forma parece variar entre homens e mulheres que apresentam o mesmo registo nas dimensões de presentismo avaliadas, deduzindo-se algum efeito DIF associado ao género. Neste sentido, pensamos que o item em questão deve ser modificado de forma a não ser afectado pela variável género e consequentemente afectar a validade da sub-escala a que pertence. De referir também que a sub-escala Compreensão Evitada não apresenta quaisquer indícios de DIF associada à variável género.
No âmbito da correlação entre sub-escalas, encontramos alguns indicadores interessantes de concomitância associados a correlações significativas entre as duas sub-escalas da SPS-6 e a dimensão global do WLQ. Apesar de significativos (p<.01), os valores encontrados são baixos/moderados (inferiores a .40) e deixam antever alguma independência entre factores. Perante estas evidências, podemos alegar a existência de complementaridade entre as dimensões de presentismo apresentadas neste trabalho. De referir ainda o facto das correlações positivas entre Limitações no Trabalho e Trabalho Completado descreverem uma medida directa de presentismo (quanto maiores os scores, maior o nível de presentismo). Estas medidas contrastam com Distracção Evitada, cuja correlação negativa com as restantes dimensões sugerem uma medida invertida de presentismo (quanto maior o valor em Distracção Evitada menor o nível de presentismo).
Em suma, estas duas versões reduzidas da escala de presentismo apresentam propriedades psicométricas bastante interessantes e reforçam a sua aplicação em futuros estudos. Todavia, estas não escondem algumas lacunas, essencialmente pelo facto de SPS2 apresentar um coeficiente de regressão baixo com a medida de Trabalho Completado. De igual modo, em virtude do SPS6 apresentar algum viés associado à variável género, poderá supor alterações nas características dos itens em causa. Apesar de tudo, pensamos que o SPS-6 surge como uma boa escala para avaliar perdas de produtividade associada a factores psicológicos (Distracção Evitada) e físicos (Trabalho Completado). Pela existência de algum factor moderado de DIF no item WLQ3, podemos sugerir uma modificação de este terceiro item da escala da WLQ.
Por último, resta referir que este estudo deu seguimento a uma tradição de estudos de presentismo junto de amostras pertencentes aos sectores da educação e saúde. Outros factores como o Burnout podem surgir como importantes variáveis moderadoras junto destas populações (Borges, Argolo, Pereira, Machado, & Souza da Silva, 2002). Neste sentido, pensamos que seria interessante analisar o comportamento das escalas junto de populações com outras características. No entanto, estes instrumentos apresentam, já nesta versão, um conjunto de características psicométricas interessantes, a justificarem a sua utilização em contexto organizacional. Pensamos, deste modo, trazer um contributo importante para literatura e para psicologia, importando um dos conceitos recentes na literatura moderna e nos modelos de investigação actuais. Ao disponibilizarmos estas versões, pretendemos fomentar a utilização destes instrumentos pelos gestores de recursos humanos, e outros responsáveis organizacionais, com vista a detectar padrões de inactividade associados ao presentismo.
Referências
Aliste, A. M. F. (1996). Funcionamiento diferencial de los items. In J. Muñiz, J. (Coord.), Psicometría (pp. 371-455). Madrid: Editorial Universitas, SA. [ Links ]
Allen, H., Hubbard, D., & Sullivan, S. (2000). The burden of pain on employee health and productivity at a major provider of business services. Journal of Occupational and Environmental Medicine, 47, 658-670. [ Links ]
Allen, H., & Sullivan, S. (2006). Seeing the "Health" in Health Care Costs. Harvard Business Review, 84, 48-56. [ Links ]
Anastasi, A., & Urbina, S. (2000). Testagem Psicológica. Porto Alegre: Artes Médicas. [ Links ]
Arbuckle, J. L. (2005). AMOS 6.0 Users Guide. Chicago, IL: SPSS Inc. [ Links ]
Aronson, G., Gustafson, K., & Dallner, M. (2000). Sick but yet at work: an empirical study of sickness presenteeism. Journal Epidemiol. Community Health, 54, 502-509. [ Links ]
Beaton, D. E., & Kennedy, C. A. (2005). Beyond return to work: Testing a measure of at-work disability in workers with musculoskeletal pain. Quality of Life Research, 14, 1869-1879. [ Links ]
Borges, L.D., Argolo, J.C., Pereira, A.L., Machado, E.A., & Souza da Silva, W. (2002). A syndrome de burnout e os valores organizacionais: Um estudo comparativo em hospitais universitários. Psicologia: Reflexão e Crítica, 15, 189-200. [ Links ]
Camilli, G. (2006). Test Fairness. In R. L. Brennan (Ed.). Educational Measurement (pp. 221-256). Wesport, CT: CE/Praeger. [ Links ]
Cortina, J. M. (1993) What is coefficient alpha? An examination of theory and applications. Journal of Applied Psychology and Aging, 78, 98-104. [ Links ]
Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., Strahan, E. J. (1999). Evaluating the use of exploratory factor analysis in psychology research. Psychological Methods, 4, 272-299. [ Links ]
Goetzel, R. Z., Ozminkowski, R. J.,& Long, S. (2003). Development and reliability analysis of the work productivuty short inventory (WPSI). Instrument measuring employee health and productivity. Journal of Occupational and Environmental Medicine, 45, 743-762. [ Links ]
Hancock, G. R. & Freeman, M. J. (2001). Power and sample size for the root mean square error of approximation test of not close fit in structural equation modeling. Educational and Psychological Measurement, 61, 741-758. [ Links ]
Hemp, P. (2004). Presenteeism: at work but out of it. Havard Business Review, 82, 49-58. [ Links ]
Horn, J. L. (1965). A rationale and test for the number of factors in factor analysis. Psychometrika, 23, 187-200. [ Links ]
Hoyle, R. H., & Panter, A. T. (1995). Writing about structural equation models. In R. H. Hoyle (Ed.), Structural equation modeling: Concepts, issues, and applications (pp. 158-176). Thousand Oaks, CA: Sage Publications. [ Links ]
Hu, L. T., & Bentler, P. M. (1995). Evaluating model fit. In R. H. Hoyle (Ed.), Structural equation modeling: Concepts, issues, and applications (pp. 76-99). Thousand Oaks, CA: Sage. [ Links ]
Kessler, R. C., Adler, L., Ames, M., Barkley, R. A., Birnbaum, H., Greenberg, P., et al. (2005). The prevalence and effects of adult attention deficit/ hyperactivity disorder on work performance in a nationally representative sample of workers. Journal of Occupational and Environmental Medicine, 47 (6), 565-572. [ Links ]
Koopman, C., Pelletier, K. R., Murray, J. F., Sharda, C. E., Berger, M. L., Turpin, R. S., Hackleman, P., Gibson, P., Holmes, D. M.; & Bendel, T. (2002). Standford presenteeism scale: health status and employee productivity. Journal of Occupational and Environmental Medicine, 44, 14-20. [ Links ]
Lerner, D., Amick, B. C., Rogers, W. H., Malspeis, S., Bungay, K., Cynn, D. (2001). The Work Limitations Questionnaire. Medical Care, 39, 72-85. [ Links ]
Lerner, D., Reed, J. I., Massarotti, E., Wester, L. M., & Burke, T. A. (2002). The Work Limitations Questionnaire's validity and reliability among patients with osteoarthritis. J Clin Epidemiol, 55,197-208. [ Links ]
Linacre, J. M. (2000). Handout from Rasch Measurement Training Seminar. Chicago. [ Links ]
Lofland, J. H., Pizzi, L., & Frick, K. D. (2004). A review of health-related workplace productivity loss instruments. Pharmacoeconomics, 22, 165- 184. [ Links ]
MacCallum, R. C., & Austin, J. T. (2000). Applications of structural equation modeling in psychological research. Annual Review of Psychology, 51, 201-226. [ Links ]
Macmann, G. M., & Barnett, D. W. (1994). Structural analysis of correlated factors: Lessons from the verbal-performance dichotomy of the Wechsler Scales. School Psychology Quarterly, 9, 161-197. [ Links ]
Martinez, L. F., Ferreira, A. I., Sousa, L. M., & Cunha, J. V. (2007). A esperança é a última a morrer? Capital psicológico positivo e presentismo. Comportamento Organizacional e Gestão, 13, 37-54. [ Links ]
McKevitt, C., Morgan, M., Dundas, D., & Holland, W.W. (1997). Sickness absence and 'working through' illness: a comparison of two professional groups. Journal of Public Health Medicine, 19, 295-300. [ Links ]
Mattke, S.; Balakrishnan, A.; Bergamo, G; & Newberry, S. J. (2007). A review of methods to measure health-related productivity loss. American Journal Managed Care, 13, 211-217 [ Links ]
O'Connor, B. P. (2000). SPSS and SAS programs for determining the number of components using parallel analysis and Velicer's MAP test. Behavior Research Methods, Instrumentation, and Computers, 32, 396-402. [ Links ]
Ozminkowski, R. J., Goetzel, R. Z., Chang, S., & Long, S. (2004). The application of two health and productivity instruments at a large employer. Journal of Occupational and Environmental Medicine, 46, 635-648. [ Links ]
Ozminkowski, R. J., Goetzel, R. Z., & Long, S. R. (2003). A validity analysis of the work productivity short inventory (WPSI) instrument measuring employee health and productivity. Journal of Occupational and Environmental Medicine, 45, 1183-1195. [ Links ]
Prasad, M., Wahlqvist, P., Shikiar, R., & Shih, Y. (2004). A review of self-report instruments measuring health-related work productivity: A patient-reported outcomes perspective. PharmacoEconomics, 22, 225-244. [ Links ]
Pilette, P. C. (2005). A clear and present danger to productivity. Journal of Nursing Administration, 35, 300-303. [ Links ]
Prieto, G., & Delgado, A. R. (2003). Análisis de un test mediante el modelo de Rasch. Psicothema, 15, 94-100. [ Links ]
Prieto, G., & Velasco, A. D. (2002). Construção de um teste de visualização a partir da psicologia cognitiva. Avaliação Psicológica, 1, 39-47. [ Links ]
Simpson, R. (1998). Presenteeism, power and organizational change: long hours as a career barrier and the impact on the working lives of women managers. British Journal of Management, 9, S37-S50. [ Links ]
Sisto, F. F., Bartholomeu, D., Santos, A. A. A., Rueda, F. J. M. & Suehiro, A. C. B. (2008). Funcionamento Diferencial de Itens para Avaliar a Agressividade de Universitários. Psicologia: Reflexão e Crítica, 21(3), 474-481. [ Links ]
Smit, R. M. (2004). Detecting item bias with the Rasch model. In E. V. Smith, Jr, and R. M. Smith (Eds), Introduction to Rasch Measurement (pp. 391-459). Maple Grove, Minnesota: JAM Press. [ Links ]
Soarez, P. C., Kowalski, C. C. G., Ferraz, M. B., & Ciconelli, R. M. (2007). Tradução para português brasileiro e validação de um questionário de avaliação de produtividade. Revista Panamericana Salud Publica, 22, 21-28. [ Links ]
Sousa, L. M. M. (2005). Presenteísmo: um perigo para o bem-estar dos enfermeiros e para a sua produtividade. Revista Portuguesa de Enfermagem, 4, 27-31. [ Links ]
Streiner, D. L., & Norman, G. R. (1995). Health measurement scales: A practical guide to their development and use (2nd ed.) Oxford: Oxford University Press. [ Links ]
Thompson, B. (2004). Exploratory and confirmatory factor analysis. Washington, DC: APA. [ Links ]
Velicer, W. F., Eaton, C. A., and Fava, J. L. (2000). Construct explication through factor or component analysis: A review and evaluation of alternative procedures for determining the number of factors or components. In R. D. Goffin, and E. Helmes, (Eds.), Problems and solutions in human assessment (pp. 41-71). Boston: Kluwer. [ Links ]
Wang, P. S., Beck, A., Berglund, P., Leutzinger, J. A., Pronk, N., Richling, D., Schenk, T. W., Simon, G., Stand, P., Ustun, T. B., & Kessler, R. C. (2003). Chronic medical conditions and work performance in health and work performance questionnaire calibration surveys. Journal of Occupational and Environmental Medicine, 42, 1303-1311. [ Links ]
West, S. G., Finch, J. F., & Curran, P. J. (1995). Structural equation models with nonnormal variables: Problems and remedies. In R. H. Hoyle (Ed.), Structural equation modeling: Concepts, issues and applications (pp. 56-75). Newbury Park, CA: Sage. [ Links ]
Wolfe, E., & Smith Jr, E.V. (2007). Instrument development tools and activities for measure validation using Rasch Models: Part II - Validation Activities. Journal of Applied Measurement, 8, 204-234. [ Links ]
Wright, B. D., & Linacre, J. M. (1998). Winsteps: A Rasch computer program. Chicago: Mesa Press. [ Links ]
Wright, B. D., Stone, M. H. (1979). Best test design. Rasch measurement. Chicago: MESA Press. [ Links ]
Zwick, W. R., & Velicer, W. F. (1986). Comparison of five rules for deterining the number of components to retain. Psychological Bulletin, 3, 432-442. [ Links ]
Recebido em agosto de 2009
1ª reformulação em novembro de 2009
2ª reformulação em dezembro de 2009
Aceito em fevereiro de 2010
Sobre os autores:
Aristides Isidoro Ferreira:Licenciado em Psicologia Aplicada (ISPA), Mestre em Políticas de Desenvolvimento de Recursos Humanos (ISCTE), e Doutor em Psicologia (Universidade do Minho). Colabora com diferentes instituições de ensino superior (Universidade Lusíada de Lisboa, Instituto Piaget, e INUAF). Membro do secretariado da Revista de Psicologia da Criança e do Adolescente, desenvolve ainda trabalhos de consultadoria estatística e metodológica na Faculdade de Psicologia da Universidade de Lisboa. É ainda autor de artigos e trabalhos em diversas áreas da psicologia e dos recursos humanos.
Luís Fructuoso Martinez:Licenciado em Economia (Faculdade de Economia da Universidade Nova de Lisboa), Mestre em Comportamento Organizacional (ISPA) e Doutor em Psicologia Económica e Social (Tilburg University, Países Baixos). Actualmente, é Professor Auxiliar Convidado no ISCTEIUL, leccionando nas áreas de Comportamento Organizacional, Análise de Dados e Psicologia do Consumidor. É ainda formador de SPSS e possui experiência internacional na área do Marketing (Grupo Sonae Indústria), tendo participado na 4ª edição do programa Contacto@ICEP.
Luís Manuel Mota de Sousa:Licenciado em Enfermagem e Gestão em Saúde. Pós-licenciatura de especialização em Enfermagem de Reabilitação. Mestre em Politicas de Desenvolvimento dos Recursos Humanos (ISCTE). Doutorando em Enfermagem, Universidade Católica Portuguesa. Enfermeiro especialista em Enfermagem de Reabilitação na Unidade de Cuidados Intensivos do Hospital Curry Cabral, EPE. Professor Convidado na Pós Licenciatura de Especialização em Enfermagem de Reabilitação da Universidade Atlântica.
João Vieira da Cunha:Professor Auxiliar da Faculdade de Economia da Universidade Nova de Lisboa. É doutorado em Gestão pela Sloan School of Management do MIT e mestre em Comportamento Organizacional pelo ISPA. É autor de mais de vinte capítulos, comunicações e artigos publicados em revistas científicas e profissionais. O seu trabalho científico tem sido objecto de vários prémios de investigação atribuídos pela Academy of Management e pela System Dynamics Society. A par da actividade académica, tem estado envolvido em vários projectos de consultoria empresarial e formação de executivos a nível nacional e internacional, em empresas e em ONGs.
1Contato:
E-mail:aristidesif@gmail.com