1. INTRODUCCIÓN
Durante los últimos años, los servicios de salud públicos y privados han debido enfrentar una alta demanda de atención de personas adultas con patologías cerebrales adquiridas y neurodegenerativas. Dicho fenómeno se debe a varios factores, entre ellos el progresivo envejecimiento de la población (Dey, 2017), así como la mayor sobrevida de poblaciones hospitalarias de mayor complejidad, debido al aumento de cobertura y el desarrollo de nuevos tratamientos (Hofhuis et al., 2021; Spragg et al., 2010; Suwanwela et al., 2007). Por ejemplo, datos de egresos hospitalarios del Ministerio de Salud de Chile sugieren que solo el año 2021, hubo un egreso de 29.542 personas con un diagnóstico de accidente cerebrovascular (MINSAL, 2022). Con relación a los trastornos neurodegenerativos, se ha estimado que al año 2025 el número de casos de demencia ascendería en nuestro país a 273.000 (Fuentes & Albala, 2014). La magnitud de este problema ha llevado al Ministerio de Salud a diseñar planes de acción y estrategias a nivel nacional, así como a desarrollar guías clínicas para optimizar la atención de pacientes con base en la evidencia disponible (MINSAL, 2013). Una de las recomendaciones más relevantes de estos planes y guías es la valoración adecuada de la sintomatología neuropsicológica o neuroconductual, debido a que esta es un elemento central en la presentación de estas poblaciones y frecuente causa de discapacidad (Budinich et al., 2019).
El procedimiento por medio del cual se evalúa el funcionamiento cognitivo, socio-emocional, conductual y funcional de las personas con patologías neurológicas se conoce como evaluación neuropsicológica (Hebben & Milberg, 2010; Lezak et al., 2004). Este tipo de evaluación es un procedimiento especializado que considera entrevista clínica a paciente y familiares, aplicación de pruebas de tamizaje, pruebas específicas y cuestionarios de autoreporte y reporte de terceros (Franzen, 2000). El objetivo de la evaluación neuropsicológica es contribuir tanto en el diagnóstico de una patología, como en ofrecer información relevante para la formulación de caso y establecimiento de objetivos terapéuticos (Coetzer & Balchin, 2014; Lezak et al., 2004). La evaluación neuropsicológica es usualmente llevada a cabo por psicólogos clínicos especializados en poblaciones neurológicas, también conocidos como neuropsicólogos clínicos (Lamberty & Nelson, 2012). No obstante, otros profesionales de la salud y rehabilitación (enfermeros, fonoaudiólogos, terapeutas ocupacionales, etc.) utilizan rutinariamente instrumentos de evaluación neuropsicológica para tamizar la presencia de alteraciones cognitivas específicas o para valorar en profundidad habilidades relevantes a su área de intervención (ej. lenguaje, comunicación, funcionalidad). Si bien la evaluación neuropsicológica se desarrolló inicialmente como una herramienta para valorar las consecuencias de patologías cerebrales, actualmente es también utilizada en poblaciones neuropsiquiátricas (Castro et al., 2011; Piñón et al., 2018), o contextos forenses (Alcázar-Córcoles & Verdejo-García, 2008; Stracciari et al., 2010).
En Chile, el sistema de salud se compone por dos sectores: el público (Fondo Nacional de Salud, o FONASA) y el privado (Instituciones de Salud Previsional, o ISAPRE) (Becerril-Montekio et al., 2011; González, et al., 2019). Al año 2019, el 78% de la población chilena estaba registrada en el sistema público (FONASA, 2020). Los beneficiarios de FONASA pueden acceder a diversas prestaciones orientadas a la promoción, prevención, diagnóstico, tratamiento y rehabilitación en salud (FONASA, s.f.). Dentro de la categoria diagnóstica se encuentran los procedimientos de evaluación neuropsicológica, las cuales también validan la cobertura de prestaciones en el sector privado de salud. Actualmente, FONASA consta con 21 instrumentos de evaluación neuropsicológica incluidos en su catálogo de prestaciones (Tabla 1). Estos instrumentos están orientados a la evaluación de diversos dominios cognitivos (Eficiencia Cognitiva Global, Atención, Capacidades Visoconstructivas y Visoespaciales, Lenguaje, Memoria, Funciones Ejecutivas) así como la valoración de problemas neuropsiquiátricos y funcionalidad en la vida diaria. Entre los años 2017 y 2021 se realizaron 231.136 procesos de evaluación neuropsicológica, y el año 2020 fue el que presentó mayor cantidad de evaluaciones con un total de 120.527 (FONASA, 2022).
Tabla 1 Instrumentos de Evaluación Neuropsicológica ofrecidos por el Fondo Nacional de Salud (FONASA) de Chile
| Sigla | Nombre de la prueba |
|---|---|
| ACE-R | Addenbrooke’s Cognitive Examination - Revised |
| ADLQ | Activities of Daily Living Questionnaire |
| BGT | Bender Gestalt Test |
| BGTBIP | Bender-Gestal Test Background Interference Procedure |
| BNT | Boston Naming Test |
| CVLT | California Verbal Learning Test |
| DT | Domino Test |
| ECAS | Edinburgh Cognitive and Behavioral ALS Screen |
| FAB | Frontal Assessment Battery |
| FCSRT | Free and Cued Selective Recall Reminding Test/Grober-Buschke |
| IADL | Instrumental Activities of Daily Living Scale |
| LNNB | Luria-Nebraska Neuropsychological Battery |
| MMSE | Mini-Mental State Examination |
| MOCA | Montreal Cognitive Assessment |
| NPI-Q | Neuropsychiatric Inventory Questionnaire |
| ROCF | Rey-Osterrieth Complex Figure |
| RPM | Raven Progressive Matrices |
| VFT | Verbal Fluency Test |
| WMS III | Wechsler Memory Scale |
| WCST | Wisconsin Card Sorting Test |
| WAIS | Wechsler Adult Intelligence Scale |
Como hemos señalado arriba, una adecuada evaluación de la sintomatología neuropsicológica o neuroconductual es un aspecto central del protocolo de atención de personas con patologías neurológicas adquiridas o degenerativas. En consecuencia, es necesario disponer de instrumentos de evaluación que sean válidos y confiables, es decir, que efectivamente midan el constructo neuropsicológico que se desea medir (Mondini et al., 2022). De acuerdo al Consorcio Americano de Asociaciones de Psicología, la validez de un instrumento hace referencia al grado en que la evidencia acumulada apoya la interpretación de los puntajes de acuerdo con el propósito del test (Urbina, 2004). Por otro lado, la confiabilidad, o precisión del instrumento, refiere a la cualidad de un test de proveer puntajes que son consistentes a lo largo de distintas evaluaciones. Además de validez y confiabilidad, existen otras propiedades relevantes para el desarrollo de instrumentos neuropsicológicos como lo es la existencia de datos normativos que permitan comparar el rendimiento del sujeto con otros, considerando edad y nivel educacional (Mondini, et al., 2022), así como también la ausencia de sesgos culturales (Fernández & Abe, 2018). En la Tabla 2 se definen los diversos métodos de establecer la validez y confiabilidad de un instrumento.
Tabla 2 Glosario de términos psicométricos utilizados en la revision sistemática
| Tipos de Confiabilidad | |
| Consistência interna | Consistencia entre los resultados de distintos ítems que intentan medir la misma variable |
| Formas paralelas | Consistencia entre los resultados entre dos versiones de un mismo instrumento |
| Interjueces | Consistencia con que distintos evaluadores evalúan de la misma forma el rendimiento de un sujeto |
| Test-retest | Consistencia entre dos mediciones del test realizadas en momentos distintos |
| Tipos de Validez | |
| Convergente | Relación entre dos o más test que pretendan medir una misma variable. Por ejemplo, correlación entre los puntajes de dos test que evalúen memoria |
| Contenido | Relación teórica entre los ítems y las variables que se pretenden evaluar. Por ejemplo, que cada criterio diagnóstico de una patología tenga asociado uno o más ítems de evaluación dentro del test. |
| Constructo | Relación matemática interna entre los ítems de un instrumento y su representación de la variable que se pretende estudiar. Por ejemplo, correlación de entre un ítem que mide memoria y uno que mide función ejecutiva |
| Criterio | Relación entre el puntaje obtenido en un instrumento y un criterio externo que evalúe la misma variable. Por ejemplo, la correlación del puntaje obtenido con el criterio diagnóstico de un profesional experto |
| Divergente | Relación entre dos o más test que miden variables opuestas o distintas. Por ejemplo, relación entre el puntaje obtenido en un test que mide bienestar subjetivo y otro que mide malestar subjetivo |
| Ecológica | Relación entre el del resultado obtenido en el instrumento con la variable en un entorno cotidiano. Por ejemplo, que el resultado de una prueba coincida con la capacidad de memoria del sujeto en su vida cotidiana |
| Predictiva | Relación del resultado obtenido en el instrumento con la predicción de una variable en el futuro o en otro ámbito. Por ejemplo, la capacidad de un instrumento para predecir el desarrollo de deterioro cognitivo a cinco años |
| Otros conceptos relevantes | |
| Baremos | Conjunto de datos acerca del resultado esperado en una variable para un determinado grupo. Por ejemplo, el puntaje esperado para un niño de 12 años, chileno, en una prueba lectura. |
Sin embargo, se ha señalado que una de las faltas a la ética más comunes en evaluación neuropsicológica en Latinoamérica es el uso de instrumentos no validados (Panyavin et al., 2015). Particularmente en Chile, no se cuenta aún con un estudio o guía clínica que evalúe la calidad de los instrumentos de medición neuropsicológica ofrecidos por FONASA. Y, en la misma línea, el organismo estatal no cuenta con una declaración explícita acerca de bajo qué criterios se han incluido ciertos instrumentos en su lista de prestaciones. Es por estas razones que se hace necesario revisar la evidencia existente respecto a la validez y confiabilidad de estas pruebas y cuestionarios, de forma de avanzar en el desarrollo de una batería de instrumentos suficientemente amplia y flexible, pero sensible a factores idiomáticos, educacionales, socioeconómicos y culturales (Pedraza & Mungas, 2008).
Con base en los antecedentes expuestos, el presente trabajo busca responder, en relación con las evaluaciones neuropsicológicas incluidas en el listado de prestaciones de FONASA, ¿Qué instrumentos presentan evidencia de su validez y confiabilidad en población chilena?, y ¿Cuál es la calidad de la evidencia disponible?
Por lo tanto, el objetivo general es evaluar la calidad de la evidencia disponible para el uso de instrumentos de evaluación neuropsicológica que forman parte de las prestaciones de FONASA. Dentro de los objetivos específicos consideramos i) caracterizar las condiciones de producción de los estudios; ii) caracterizar las poblaciones a las que se refieren los estudios; iii) describir las áreas cognitivas que abordan las pruebas; iv) describir las propiedades psicométricas de confiabilidad y validez de los instrumentos, y; v) evaluar la calidad de la validación reportada por las pruebas.
2. MÉTODO
Se realizó una revisión sistemática de la literatura científica referente a estudios de adaptación, validación o estandarización de los instrumentos de evaluación neuropsicológica, que están incluidos dentro de las prestaciones de FONASA, para lo cual se utilizó el formato Prisma Scoping Review (Tricco et al., 2018).
2.1 Criterios de Elegibilidad
Los criterios de inclusión fueron i) investigaciones empíricas; ii) sometidas a juicio de pares, ya sea comité editorial de revistas científicas o comisión académica, en el caso de tesis de pre o postgrado; iii) que incluyan al menos uno de los instrumentos neuropsicológicos ofrecidos como prestación por FONASA; iv) que el objetivo del estudio sea el desarrollo de estandarización del uso y evaluación del instrumento en población chilena, o la evaluación de las propiedades psicométricas de los mismos; v) estudios publicados en español, inglés o portugués. Cabe destacar que no se estableció un criterio temporal (rango de años) a priori para la selección de los artículos. No fueron incluidos artículos teóricos, comentarios, opiniones y revisiones sistemáticas.
2.2 Procedimientos de Búsqueda
La búsqueda fue realizada durante el mes de julio del año 2021 en dos bases de datos de literatura convencional, y dos de literatura no-convencional o literatura gris. Se optó por búsquedas en bases de literatura gris, dada la posibilidad de que algún estudio estuviese publicado como tesis o tesina, sin haber llegado a publicarse como artículo en una revista científica o académica indexada.
Dentro de las bases de literatura convencional se incluyó una base internacional (Web Of Science, WOS) y una con mayor representación de textos producidos en Latinoamérica (Scientific Electronic Library Online, Scielo). Por otro lado, las bases de literatura gris corresponden a la Red de Repositorios Latinoamericanos, a cargo de la Universidad de Chile, y el repositorio de la Red Federada de Repositorios Institucionales de Publicaciones Científicas, ambos dedicados a publicaciones de Latinoamérica. Cabe señalar que el segundo repositorio se eligió, además, debido a que la Agencia Nacional de Investigación y Desarrollo (ANID) del Estado de Chile utiliza este portal para indexar las tesis de magíster y doctorado de sus becarios en dicho portal.
La búsqueda se desarrolló integrando la estrategia y listado de chequeo de PRESS (Peer Review of Electronic Search Strategies), la cual consideró una base de datos general de llenado. Los términos de búsqueda correspondieron a los nombres o siglas de las pruebas neuropsicológicas seleccionadas, conceptos referentes a Chile y/o conceptos referentes a estúdios psicométricos (p.ej. ‘adaptación’, ‘validación’, ‘estandarización’). Todos los conceptos fueron listados tanto en inglés como en español (ver Tabla 3).
Tabla 3 Listado de palabras clave utilizadas para la búsqueda en base de datos
| Prueba | Idioma | Palabras Clave |
|---|---|---|
| ACE-R | ENG/ESP | Addenbrooke, ACE-R |
| ADQL | ENG | Activities of daily living questionnaire, ADLQ |
| ESP | Cuestionario de actividades de la vida diaria, ADLQ | |
| BGT | ENG | Bender Gestalt Test, Test, Bender-Gestalt, BIP |
| ESP | Test de Bender-Gestalt, Prueba Gestáltica de Bender, Bender, Prueba Gestáltica Visual-Motora de Bender | |
| BGTBIP | ENG | Bip-Bender OR BIP Bender OR Test, Bender-Gestalt OR Bender Visual Motor Gestalt Test)) AND (CU = (Chile OR chilean)) |
| ESP | Test de Bender, BIP Bender, Metodo Bip de Canter, Test de Bender-Gestalt, Prueba Gestáltica de Bender | |
| BNT | ENG | Boston Naming Test, Boston 60, 60-item Boston Naming Test, BNT |
| ESP | Test de nominación de Boston, Boston 60, BNT, Test de denominación de Boston | |
| CVLT | ENG | California verbal learning test, CVLT |
| ESP | Test de Aprendizaje Verbal de California, CVLT | |
| DT | ENG/ESP | Domino 48, Domino Test, domino-type tests, D-48 |
| ECAS | ENG | ECAS, Edinburgh Cognitive and Behavioural ALS Screen |
| ESP | ECAS, Edinburgh | |
| FAB | ENG | Frontal Assessment Battery, FAB |
| ESP | Batería neuropsicológica de evaluación de funciones frontales, Batería de Evaluación del Lóbulo frontal | |
| FCSRT | ENG | Free and cued selective reminding test, FCSRT, Test Grober and Buschke |
| ESP | Prueba De Grober y Buschke, Prueba de Memoria de Palabras de Grober y Buschke, Test de memoria episódica verbal de Grober y Buschke | |
| IADL | ENG | Lawton Brody Physical Self-Maintenance Scale, Instrumental activities of daily living, IADL, IADLs |
| ESP | Escala de Lawton y Brody, Actividades instrumentales de la vida diaria | |
| LNNB | ENG | Neuropsychological Battery Luria-Nebraska, Luria Nebraska |
| ESP | Batería Luria-Nebraska, LNNB | |
| MMSE | ENG | Mini Mental State Examination, MMSE, Folstein Mini-Mental State Examination, Mini Mental Status Examination |
| ESP | MMSE de Folstein, Mini-Examen del Estado Mental | |
| MOCA | ENG | Montreal Cognitive Assessment, MoCA |
| ESP | Evaluación Cognitiva de Montreal | |
| NPI-Q | ENG | Neuropsychiatric inventory short form, NPI-Q |
| ESP | Inventario neuropsiquiátrico | |
| ROCF | ENG | Rey Osterrieth, Rey-Osterrieth, Rey-Osterrieth complex figure test, RCFT, ROCF, ROCFT |
| ESP | Figura Compleja de Rey, FCRO | |
| RPM | ENG | Raven’s progressive matrices, Raven Progressive Matrices, Raven’s Matrices, Raven Matrices |
| ESP | Test de matrices progresivas de Raven, Matrices de Raven | |
| VFT | ENG | Verbal fluency test, animals |
| ESP | Fluencia verbal, animal | |
| WMS III | ENG | WMS, Weschler Memory Scale |
| ESP | Escala de Memoria Weschler | |
| WCST | ENG | Wisconsin Card Sorting Test, WCST |
| ESP | Cartas, Wisconsin | |
| WAIS-IV | ENG | WAIS, Wechsler Adult Intelligence Scale |
| ESP | Inteligencia. Wechsler |
2.3 Codificación de Variables. Selección de los estudios
Los artículos fueron seleccionados según criterios PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses), realizando en primer lugar un cribado por título y resumen, y luego una selección por lectura a texto completo.
El cribado se realizó a ciegas por cuatro investigadores, conociendo los resultados de los pares sólo al terminar la revisión. El investigador principal revisó la totalidad de los artículos, mientras que tres colaboradores dividieron la base de datos en partes iguales para la revisión. Para la inclusión de un artículo, este debía contar con el acuerdo del investigador principal y un colaborador. Frente a los desacuerdos se realizó una reunión para la unificación de criterios y una segunda selección. Aquellos artículos en que se mantuvo el desacuerdo por título/resumen, se incluyeron para su revisión a texto completo. La selección final de artículos para análisis cualitativo fue realizada por el investigador principal.
2.4 Proceso de extracción de datos
Los artículos fueron trabajados en el gestor de referencias EndNote X9, el gestor de hojas de cálculo Microsoft Excel y la aplicación web para revisiones sistemáticas Rayyan (Ouzzani et al., 2016). La extracción de datos fue realizada por el investigador principal, más una investigadora colaboradora, y corroborada por una tercera investigadora.
2.5 Análisis de datos
Cada variable fue discutida y aprobada por el equipo de investigación, las cuales contribuyeron al logro de los objetivos planteados previamente. Las variables que consideran aspectos generales del estudio fueron; i) año, ii) tipo de muestreo, iii) grupo clínico, iv) tamaño de la muestra, v) zona geográfica de la muestra, vi) edad, vii) nivel socioeconómico, viii) años de educación; y ix) áreas cognitivas evaluadas. En cuanto a las variables de validación se consideraron criterios de confiabilidad, tales como i) consistencia interna, ii) criterio interjueces, iii) formas paralelas, iv) test-retest. Por otro lado, en cuanto a la validez se consideraron los tipos i) convergente, ii) de contenido, iii) de constructo, iv) de criterio, vi) divergente, vii) ecológica, y viii) predictiva.
Junto a lo anterior, se consideró la revisión de la calidad de la validación de los instrumentos. Para esto se utilizó el “Cognitive Screening Standardization Checklist” (CSSC), el cual corresponde a un instrumento diseñado para evaluar la calidad de las pruebas de cribado (screening) cognitivo existentes (Aiello et al., 2022). Esta herramienta de evaluación de la calidad se basa en la adecuación de la muestra, las propiedades psicométricas y diagnósticas y la viabilidad del uso de los instrumentos de cribado cognitivo (Aiello et al., 2022). Se consideró que este instrumento podría ser útil para esta revisión en tanto ya había sido utilizado para evaluar la calidad de instrumentos de evaluación neuropsicológica en Italia (Aiello et al., 2022).
El CSSC se compone de dos secciones que evalúan elementos centrales del proceso de validación de un instrumento, a saber: “Escala de muestreo” (puntaje de 0 a 13) y “Escala de psicometría, diagnóstico y usabilidad” (puntaje de 0 a 29) (Aiello et al., 2022). La primera sección evalúa la adecuación del muestreo incluido en el estudio en cuanto a representatividad de la población objetivo, mientras que la segunda sección se centra en las propiedades psicométricas, diagnósticas y de viabilidad del instrumento en cuestión. Las puntuaciones totales del CSSC oscilan entre 0 y 42; donde un mayor puntaje implica mayor rigurosidad y calidad de la validación de cada instrumento (Aiello et al., 2022). Sin embargo, los autores no indican un puntaje de corte para la clasificación e interpretación de los resultados de la evaluación de la calidad de los estudios.
Cada uno de los artículos incluidos en la presente revisión fueron evaluados considerando los elementos descritos y operacionalizados en el CSSC. En primer lugar, este procedimiento se realizó de manera paralela por los revisores, con el objetivo de asegurar la consistencia interna. Una vez alcanzada la consistencia interna respecto a los criterios del CSSC, los estudios fueron evaluados de manera independiente por los revisores.
Finalmente, los datos fueron agrupados, según los objetivos planteados, siguiendo los lineamientos de PRISMA Scoping Review (Tricco et al., 2018).
4. RESULTADOS
4.1 Resultados Generales y Principales
La búsqueda arrojó 1791 resultados, de los cuales 686 fueron artículos duplicados. De los 1105 artículos cribados por título y resumen, se descartaron 1064 por no cumplir con los criterios de inclusión. Finalmente, tras la revisión a texto completo, 14 artículos se consideraron para su análisis cualitativo (ver Figura 1; Tabla 4).
Tabla 4 Descripción de los artículos seleccionados
| Id | Autor (año) | Afiliación | Idioma | Revista | País revista | Test a evaluar | Áreas que evalúa el test | Test o indicador de contraste | Muestreo | Grupo etario | Grupo clínico | N |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | Alarcón et al. (2012) | Chile | Esp | Psico-USF | Brazil | RPM | Inteligencia bajo la teoría de dos factores de Spearman (Factor G = capacidad cognoscitiva global / Factor S = factores específicos como las aptitudes verbales y numéricas), se enfoca principalmente en el factor G. | RPM, versión inglesa (2008), escolaridad | No probabilístico, intencionada | AM | 102 | |
| 2 | Mansilla et al. (2012) | Chile | Esp | Terapia psicológica | Chile | RPM | Busca abarcar ampliamente las capacidades intelectuales, tanto generales como específicas. Su objetivo principal es dar cuenta de la progresión total del desarrollo intelectual de un individuo. | RPM-Ch-ME (Ivanovic, et. al, 2000) | No probabilístico, intencionada | NNA | Institucionalizados | 75 |
| 3 | Muñoz-Neira et al. (2012) | Chile | Esp | Revista médica de chile | Chile | ACE-R | Evalúa 5 dominios cognitivos: Orientación y Atención, Memoria, Fluencias Verbales, Lenguaje y Habilidades Visoespaciales. Su objetivo es detectar precozmente las enfermedades demenciales y ayudar a diferenciar entre distintos tipos de ellas. | CDR, MMSE-Ch, ADQL-Ch, PFAQ, IADL, AD8-Ch, Proxy | No probabilístico, por conveniencia | AM | D. DCL | 127 |
| 4 | Rosas et al. (2014) | Chile | Esp | Psykhe | Chile | WAIS-IV | Permite la evaluación comprensiva de la inteligencia desde los 16:00 hasta los 90:11 años. Evalúa los siguientes dominios: Comprensión verbal, Índice de razonamiento Perceptual, Índice de Memoria de Trabajo, Índice de Velocidad de Procesamiento, Habilidad general y Coeficiente Intelectual Total. | Nivel educacional, edad | No probabilístico, intencionada | Ad, A, AM | 887 | |
| 5 | Olabarrieta-Landa et al., (2015a) | Multi | Ing | NeuroRehabilitation | Holanda | VFT | Mide la capacidad individual para el funcionamiento cognitivo complejo, como el lenguaje y el funcionamiento ejecutivo. Específicamente el test mide la fluidez verbal, siendo los aspectos más comúnmente medidos el fonológico y el semántico. | No probabilístico, por cuotas | A, AM | 320 | ||
| 6 | Olabarrieta-Landa et al., (2015b) | Multi | Ing | NeuroRehabilitation | Holanda | BNT | Se usa para identificar individuos con diferentes patologías clínicas, incluyendo trastornos de la comunicación, afasias u otros trastornos del lenguaje causados por golpes, enfermedad de alzheimer o lesiones cerebrales. Por lo tanto, el test se usa para detectar problemas en la recuperación de palabras y evaluar trastornos del lenguaje | No probabilístico, por cuotas | A, AM | 320 | ||
| 7 | Rivera et al. (2015) | Multi | Ing | NeuroRehabilitation | Holanda | ROCF (instant recall) | Fue creado para medir la percepción visual, la habilidad constructiva visual-espacial, memoria visual y capacidades de memoria no verbal. Se teoriza que igualmente permite medir varias dimensiones cognitivas que incluye estrategias de planificación y resolución de problemas, niveles de atención y concentración al igual que coordinación de motricidad fina y habilidades organizativas. | No probabilístico, por cuotas | A, AM | 320 | ||
| 8 | Delgado et al. (2016) | Chile | Ing | Archives of clinical neurpsychology | Inglaterra | FCSRT | Es una herramienta para detectar la enfermedad de Alzheimer en etapas tempranas. Evalúa memoria incluyendo un procedimiento específico para asegurar que la atención se centra en la tarea. Fomenta igualmente un mayor procesamiento semántico. | CDR, MMSE, ACE-R, FAB, Proxy | No probabilístico, por conveniencia | AM | DCL | 92 |
| 9 | Arango-Lasprilla et al., (2017) | Multi | Ing | NeuroRehabilitation | Holanda | ROFC (3 min recall) | Creado para examinar la capacidad visoespacial y memoria en pacientes con heridas de trauma cerebral. Evalúa funciones cerebrales incluyendo atención, memoria de trabajo, habilidades visoespaciales y de planificación. | No probabilístico, por cuotas | NNA | 387 | ||
| 10 | Musa et al. (2017) | Chile | Ing | Dementia e Neuropsicologia | Brazil | NPI-Q | Mide la severidad y presencia de 12 síntomas neuropsiquiátricos de las demencias, incluyendo delirios, alucinaciones, agitación/agresión, disforia/depresión, ansiedad, euforia/euforia, apatía/indiferencia, desinhibición, irritabilidad/labilidad, comportamientos motores aberrantes, alteraciones del comportamiento nocturno y alteraciones del apetito/alimentación. Permite igualmente medir el malestar respectivo de los cuidadores. | ACER-R-Ch, CDR | No probabilística, por conveniencia | AM | D | 53 |
| 11 | Olabarrieta-Landa et al. (2017) | Multi | Ing | NeuroRehabilitation | Holanda | VFT | Se usa para acceder a las funciones ejecutivas complejas, incluyendo disfunciones ejecutivas. Específicamente mide la fluidez verbal, definida como la habilidad de formar y expresar palabras en concordancia con el criterio requerido. | No probabilístico, por cuotas | NNA | 387 | ||
| 12 | Delgado et al. (2019) | Chile | Esp | Neurología | España | MOCA | Creado como herramienta de tamizaje para detectar deterioro cognitivo leve. Evalúa funciones ejecutivas, atención, abstracción, memoria, lenguaje, capacidades visoconstructivas, cálculo y orientación. | CDR, DSM-IV, MMSE | No probabilístico, por cuotas | AM | D. DCL | 172 |
| 13 | Bello-Lepe et al. (2020) | Chile | Ing | Dementia and geriatric cognitive disorders | Suiza | MOCA | Ayuda en la detección de trastornos neurocognitivos leves. Mide 7 dominios cognitivos: habilidad visoespacial ejecutiva, nominación, memoria, atención, lenguaje abstracción y orientación. | MMSE, CDR | AM | DCL, DCM | 226 | |
| 14 | Cancino et al. (2020) | Chile | Esp | Revista médica de chile | Chile | ACE-R, MMSE, MOCA | MMSE = evalúa orientación, repetición inmediata, atención, cálculo, memoria y lenguaje. MOCA = habilidad visoespacial, denominación, memoria, atención, lenguaje, abstracción, orientación y recuerdo diferido. ACE-R = 6 dominios cognitivos, orientación, atención, memoria, fluidez verbal, lenguaje y habilidad visoespacial. | No probabilístico, por conveniencia | AM | 203 |
Nota. A: Adulto; AM: Adulto Mayor; NNA: Niños, niñas y adolescentes. D: Demencia; DCL: Deterioro Cognitivo Leve; DCM: Deterioro Cognitivo Medio.
En cuanto a sus condiciones de producción, los estudios seleccionados fueron publicados entre el año 2012 y el 2020. Respecto de las afiliaciones de sus autores, nueve de las 14 publicaciones tienen a todos sus autores afiliados a instituciones chilenas y cinco corresponden a estudios multicéntricos, que incluyen autores de diversos países. Todos los estudios multicéntricos revisados corresponden a un mismo grupo de autores liderados por Juan Carlos Arango-Lasprilla del Hospital Universitario de Cruces, España, quienes realizaron investigaciones de validación de diversas pruebas de evaluación neuropsicológica en población española y latinoamericana, incluyendo a Chile, Cuba, Ecuador Guatemala, Honduras, México, Paraguay, Perú y Puerto Rico. En relación con las revistas en que fueron publicados los artículos, cuatro corresponden a revistas chilenas, dos a revistas brasileñas y el resto a revistas europeas. Finalmente, ocho estudios fueron publicados en inglés y seis en español.
De las 21 pruebas de evaluación neuropsicológicas que son ofrecidas por FONASA, se encontraron estudios referentes sólo a 10 de ellas. La prueba más estudiada en esta muestra fue la Evaluación Cognitiva de Montreal (MOCA), con tres publicaciones. Sigue la prueba de ACE-R, FCRO, RPM y VFT con dos estudios. Finalmente, BNT, FCSRT, MMSE, NPI-Q y WAIS-IV con una publicación. Cabe mencionar que algunos de los artículos hacían referencia a más de una de las pruebas en cuestión. No se encontró evidencia referente a traducción, adaptación, validación o estandarización para 11 pruebas ofrecidas por FONASA: BGTBIP, BGT, CVLT, DT, ECAS, FAB, IADL, LLNB, WMS-III y WCST.
4.2 Resultados por Población y Área Cognitiva
Niños y adolescentes
Los instrumentos evaluados en esta población fueron el RPM (Mansilla et al., 2012), VFT (Olabarrieta-Landa et al., 2017), ROCF (Arango-Lasprilla et al., 2017a) y WAIS-IV (Rosas et al., 2014), con un total de cuatro publicaciones. Todos los estudios incluyeron población normotípica y de sectores urbanos. Dos estudios incluyeron participantes del sector centro-sur del país (Arango-Lasprilla et al., 2017a; Olabarrieta-Landa et al., 2017), uno del extremo sur (Mansilla et al., 2012) y uno de múltiples sectores del país (Rosas et al., 2014). Dos estudios incluyen el nivel socioeconómico como variable, mediante el nivel educativo de los padres (Rosas et al., 2014) o la condición de institucionalizados en servicios de menores estatales (Mansilla et al., 2012). Además, los cuatro artículos utilizaron un muestreo no probabilístico y no contemplaron grupos de comparación.
En cuanto a sus resultados, el estudio de Mansilla et al. (Mansilla et al., 2012) concluye que los baremos del RPM, propuestos por Ivanovich et al. (2000), son válidos para emplearlos con población infanto-juvenil socialmente vulnerable. Mientras que los estudios de Arango-Lasprilla et al. (2017a), Olabarrieta et al. (2017), Rosas et al. (2014) presentan baremos para el uso de la prueba de ROCF, VFT y WAIS-IV, respectivamente.
Al presentar estos resultados por área cognitiva, los estudios analizados presentan evidencia a favor del uso de instrumentos para realizar tamizaje de la función ejecutiva en niños y adolescentes mayores de seis años en relación con el léxico (Olabarrieta-Landa et al., 2017), habilidades visuo-constructivas, memoria visuo-espacial (Arango-Lasprilla et al., 2017a) y razonamiento lógico no-verbal (Mansilla et al., 2012). Por otro lado, se cuenta con evidencia para el estudio exhaustivo de la inteligencia mediante batería de pruebas neuropsicológicas en adolescentes desde los 16 años (Rosas et al., 2014).
Adultos
Cuatro instrumentos fueron validados en población adulta, a saber, BNT (Olabarrieta-Landa et al., 2015a), ROCF (Rivera et al., 2015), VFT (Olabarrieta-Landa et al., 2015b) y WAIS-IV (Rosas et al., 2014). Al igual que el grupo anterior, todos los estudios incluyeron sólo población sana, a la cual se accedió mediante muestreo no probabilístico. Un estudio incluyó población urbana de múltiples regiones del país (Rosas et al., 2014), mientras que los otros tres no declaran esta información (Olabarrieta-Landa et al., 2015a; Olabarrieta-Landa et al., 2015b; Rivera et al., 2015). Por otro lado, en cuanto a nivel socioeconómico, un estudio lo equipara a nivel educativo e incluye personas con un mínimo de ocho años de escolaridad hasta personas con educación superior completa (Rosas et al., 2014); los otros tres estudios no declararon el nivel socioeconómico de sus participantes (Olabarrieta-Landa et al. 2015a; Olabarrieta-Landa et al., 2015b; Rivera et al., 2015). Por último, tres estudios dividieron su muestra en grupos según nivel de escolaridad, comparando sujetos con 12 o menos años de escolaridad versus sujetos con más de 12 años de escolaridad (Olabarrieta-Landa et al. 2015a; Olabarrieta-Landa et al. 2015b; Rivera et al., 2015).
En cuanto a sus resultados, los cuatro estudios presentan evidencia a favor de la confiabilidad y validez de los instrumentos para el tamizaje de la habilidad de denominación verbal y memoria semántica (Olabarrieta-Landa et al., 2015a), fluidez verbal (Olabarrieta-Landa et al., 2015b) y habilidades visuo-constructivas y memoria visuo-espacial (Rivera et al., 2015). Además, se contaría con la batería WAIS-IV como instrumento válido y confiable para la medición de la inteligencia general y por áreas en adultos chilenos.
Adultos mayores
Para población adulto mayor se encontraron ocho publicaciones que hacían alusión a siete instrumentos neuropsicológicos: ACE-R (Muñoz-Neira et al., 2012), FCSRT (Delgado et al., 2016), MMSE (Cancino et al., 2020), MOCA (Bello-Lepe et al., 2020; Cancino et al., 2020; Delgado et al., 2019), NPI-Q (Musa et al., 2017), RPM (Alarcón et al., 2012) y WAIS-IV (Rosas et al., 2014). Todos los estudios realizaron un muestreo no probabilístico, siete en población urbana - uno no declara (Cancino et al., 2020).
En cuanto al sector geográfico del país, cuatro estudios incluyeron sólo el sector centro (Delgado et al., 2016; Delgado et al., 2019; Muñoz-Neira et al., 2012; Musa et al., 2017), uno del sur (Cancino et al., 2020), y uno el extremo sur (Alarcón et al., 2012). Mientras que dos estudios utilizaron muestras de diversas partes del país (Bello-Lepe et al., 2020; Rosas et al., 2014). Del total, sólo tres informaron el nivel socioeconómico de sus participantes (Alarcón et al., 2012; Cancino et al., 2020; Rosas et al., 2014). Tres estudios se centraron en población sana (Alarcón et al., 2012; Cancino et al., 2020; Rosas et al., 2014) mientras que el resto comparó personas sanas con personas con deterioro cognitivo leve (Delgado et al., 2019; Muñoz-Neira et al., 2012), moderado (Delgado et al., 2016) y/o demencia (Delgado, 2019; Muñoz-Neira et al., 2012). Un estudio no incluyó sujetos sanos y comparó personas con deterioro cognitivo leve y medio (Musa et al., 2017).
Primero, en población adulta mayor sana, se contaría con evidencia a favor para el uso de la batería ACE-R (Cancino et al., 2020; Muñoz-Neira et al., 2012), FCRST (Delgado et al., 2016), MOCA (Bello-Lepe et al., 2020; Cancino et al., 2020; Delgado et al., 2019), NPI-Q (Musa et al., 2017) y WAIS-IV (Rosas et al., 2014). Mientras que se desaconseja el uso de RPM (Alarcón et al., 2012) con norma extranjera debido a que los baremos no coinciden con las características de la muestra chilena. Además, Cancino et al. (2020) invitan a ser cautelosos con el uso del MMSE debido a una baja confiabilidad y poca sensibilidad a la función memoria en comparación con ACE-R y MOCA.
Segundo, en relación a deterioro cognitivo hay evidencia de que la prueba ACE-R (Muñoz-Neira et al., 2012), FCSRT (Delgado et al., 2016) y MOCA (Bello-Lepe et al., 2020; Cancino et al., 2020; Delgado et al., 2019; Muñoz-Neira et al., 2012) serían de utilidad para detectar deterioro cognitivo leve. También la prueba MOCA permitiría detectar deterioro cognitivo moderado, mientras que para la detección de demencia sería útil tanto ACE-R como MOCA.
Según área cognitiva, los ocho estudios presentan evidencia a favor de la disponibilidad de instrumentos neuropsicológicos para el tamizaje de función cognitiva global (Bello-Lepe et al., 2020; Cancino et al., 2020; Delgado et al., 2019; Muñoz-Neira et al., 2012), memoria episódica verbal (Delgado et al., 2016) y sintomatología neuropsiquiátrica (Musa et al., 2017) en población adulta mayor chilena. Además, se cuenta con evidencia para la evaluación de inteligencia global y por subáreas (Rosas et al., 2014) en dicha población.
4.3 Calidad de la Validación
Propiedades Psicométricas de los Instrumentos
A nivel descriptivo, respecto a las propiedades psicométricas de los estudios incluidos en la presente revisión, siete de los estudios incluidos evaluaron la confiabilidad (Tabla 5). De estos, todos utilizaron el método de consistencia interna y solo uno lo utilizó en combinación test-retest. Ningún estudio utilizó formas paralelas o evaluación interjueces.
Tabla 5 Descripción de los estadísticos utilizados para la validación de cada test de evaluación neuropsicológica
| Test | Autores | N | Información demográfica | Fiabilidad | Valor | Validez | Valor | Norma de puntuación |
|---|---|---|---|---|---|---|---|---|
| ACE-R | Cancino et al. (2020) | Total =203 | Edad= 69±7.2; Educ=11.7±5.9; M/H= 77/33 | Consistencia interna | α de Cronbach = 0.81 | Constructo | Adecuada cargas factoriales para todos los dominios cognitivos B>0.3, p<0.01 | --- |
| Orientación B=0.62, p<0.01 | ||||||||
| Atención B=0.66, p<0.01 | ||||||||
| Memoria B=0.49, p<0.01 | ||||||||
| Fluidez verbal B=0.59, p<0.01 | ||||||||
| Lenguaje B=0.56, p<0.01 | ||||||||
| Hab. Visuoespacial B=0.70, p<0.01 | ||||||||
| Muñoz-Neira et al. (2012) | Total =127 | Consistencia interna | [u]α[/u] de Cronbach = 0.772 | Concurrente | AD8 r=−0.633, p<0,001 | --- | ||
| ADQL r=−0.7, p<0.001 | ||||||||
| Control= 45 | Edad=73.8±7.5 ; Educ=13.1±4.6 ; M/H=56/44 | CDR rho=−0,822, p<0,001 | ||||||
| IADL r=0.65, p<0,001 | ||||||||
| DCL= 22 | Edad= 71.6±8.9; Educ=11.1±5.1 ; M/H= 45/55 | MMSE r = 0.952, p<xxxx | ||||||
| PFAQ r=−0.725, p<0.001 | ||||||||
| Demencia= 60 | Edad=73.4±8.8; Educ=10.8±5.0; M/H=52/48 | Discriminante | Diferencia estadísticamente significativa entre los grupos | |||||
| BNT | Olabarrieta-Landa et al., (2015b) | Total= 320 | Edad=55.1±19.6; M/H=58/42 | --- | Sí | |||
| < 12 años educ=241 | ||||||||
| > 12 años educ= 79 | ||||||||
| FCRST (versión palabras) | Delgado et al. (2016) | Total=92 | Consistencia interna | [u]α[/u] de Cronbach = 0.85 | Concurrente | Edad Recuerdo libre r=−0.21, p<0.01 | --- | |
| Control=50 | Edad= 71±6 ; Educ=13±4; M/H=71/29 | Escolaridad No hubo correlación significativa | ||||||
| DCM – TA= 42 | Edad= 74±6 ; Educ= 12±5; M/H=55/45 |
ACE-R (memoria) Recuerdo libre r=−0.820, p<0.001 Recuerdo total r=−0.843, p<0.001 |
||||||
|
CDR Recuerdo libre r=−0.842, p<0.001 Recuerdo total r=−0.796, p<0.001 |
||||||||
|
FAB Recuerdo libre r=0.612, p<0.001 Recuerdo total r=0.569, p<0.001 |
||||||||
|
MMSE Recuerdo libre r=0.718, p<0.001 Recuerdo total r=0.766, p<0.001 |
||||||||
|
Fluencia verbal categoría Recuerdo libre r=0.712, p<0.001 Recuerdo total r=0.660, p<0.001 |
||||||||
|
Fluencia verbal fonética Recuerdo libre r=0.492, p<0.001 Recuerdo total r=0.435, p<0.001 |
||||||||
| Discriminante | Diferencia estadísticamente significativa entre los grupos | |||||||
| FCRST (versión imágenes) | Delgado et al. (2016) | Total=90 | Consistencia interna | [u]α[/u] de Cronbach = 0.82 | Concurrente | Edad No hubo correlación significativa | ||
| Control= 50 | Edad= 71±6 ; Educ= 13±4; M/H=71/29 | Escolaridad No hubo correlación significativa | ||||||
| DCM – TA= 42 | Edad= 74±6 ; Educ= 12±5; M/H=55/45 |
ACE-R (memoria) Recuerdo libre r=−0.849, p<0.001 Recuerdo total r=−0.804, p<0.001 |
||||||
|
CDR Recuerdo libre r=−0.829, p<0.001 Recuerdo total r=−0.704, p<0.001 | ||||||||
|
FAB Recuerdo libre r=0.606, p<0.001 Recuerdo total r=0.611, p<0.001 | ||||||||
|
MMSE Recuerdo libre r=0.784, p<0.001 Recuerdo total r=0.822, p<0.001 | ||||||||
|
Fluencia verbal categoría Recuerdo libre r=0.700, p<0.001 Recuerdo total r=0.608, p<0.001 | ||||||||
|
Fluencia verbal fonética Recuerdo libre r=0.424, p<0.001 Recuerdo total r=0.372, p<0.001 | ||||||||
| Discriminante | Diferencia estadísticamente significativa entre los grupos | |||||||
| MMSE | Cancino et al. (2020) | Total =203 | Edad= 69±7.2 ; Educ= 11.7±5.9; M/H= 77/33 | Consistencia interna | α de Cronbach = 0.535 | Constructo | Adecuadas cargas factoriales para todos los dominios excepto memoria B>0.3, p<0.01 | |
|
Orientación B=0.65, p<0.01 | ||||||||
|
Atención B=0.66, p<0.01 | ||||||||
|
Lenguaje B=0.49, p<0.01 | ||||||||
|
Hab. visuoespacial B=0.59, p<0.01 | ||||||||
|
Memoria B=0.12, p=0.146 | ||||||||
| MOCA | Bello-Lepe et al. (2020) | Total =226 | Consistencia interna | α de Cronbach = 0.749 | Concurrente | Adecuada carga factorial para todos los dominios excepto identificación | ||
| Control= 113 | Edad= 71.5±7.6; Educ=1-<12 ; M/H=73/27 | |||||||
| DCL =65 | Edad= 76.9±8.7; Educ=1-<12 ; M/H=72/28 | |||||||
| DCMay=48 | Edad= 82.2±7.9; Educ=1-<12 ; M/H=65/35 | |||||||
| Cancino et al. (2020) | Total 203 | Edad= 69±7.2; Educ= 11.7±5.9; M/F= 77/33 | Consistencia interna | α de Cronbach = 0.707 | Constructo | Orientación B=0.83 | ||
| Atención B=0.41 | ||||||||
| Memoria B=0.80 | ||||||||
| Abstracción | ||||||||
| B=0.77 | ||||||||
| Lenguaje B=0.59 | ||||||||
| Hab. visuoespacial B=0.68 | ||||||||
| Identificación B=0.22, p=0.003 | ||||||||
| Delgado et al. (2019) | Total=172 | Consistencia interna | [u]α[/u] de Cronbach = 0.772 | Concurrente | MMSE - DCL-na r=0.277; d=0.58 | |||
| Control=104 | Edad=72.3±5.4; Educ=11.4±4.2; | Fiabilidad interevaluador | Coef. correlación de Spearman = 0,846, p<0,01 | MMSE - DCL-a r =0.692; d=1,90 | ||||
| DCL- NA= 24 | M/H=65/35 Edad= 74.3±7.9; Educ=12.0±4.3 ; M/H=58/42 | Fiabilidad intraevaluador (Test-Retest) | Coef. correlación de Spearman = 0.922, p<0,001 | MMSE - Demencia leve r=0.79; d=2,55 | ||||
| Discriminante | Diferencia estadisticamente significativa entre los grupos | |||||||
| DCL- A= 24 | Edad= 75.3±7.8; Educ=9.2±3.8; M/H=71/29 | |||||||
| Demencia leve=20 | Edad= 75.1±8.2; Educ=11.3±4.7; M/H=20/80 | |||||||
| NPI-Q | Musa et al. (2017) | Total =53 | Consistencia interna | [u]α[/u] de Cronbach = 0.783 | Concurrente | ACE-R r=−0.315; p>0.01 | ||
| DCL-TA= 27 | Edad=73.3±6.3 ; Educ=10.9±4.9 ; | NPI r=0.73; p>0.01 | ||||||
| DCM-TA =26 | Edad=74.4±6.5 ; Educ=12.2±4.6 ; | Discriminante | Diferencia estadísticamente significativa ente los grupos | |||||
| ROCF | Arango-Lasprilla et al., (2017) | Total = 387 | Edad= 11.5±3.5 ; EMP= 12.3±3.0 ; M/F=50/50 | --- | --- | Sí | ||
| Rivera et al. (2015) | Total =320 | Edad= 55.1±19.6; M/F=58/42 | Sí | |||||
| < 12 años educ=241 | ||||||||
| > 12 años educ =79 | ||||||||
| RPM | Alarcón et al. (2012) | Total=102 | --- | Concurrente | Norma Inglesa del test No hay equivalencia entre las normas según comparación de medias | |||
| 60-70 años= 45 | Edad= 63.3 ± 3.1; Educ=BC-MC ; M/F= 58/42 | |||||||
| Discriminante | Diferencia estadísticamente significativa ente los grupos | |||||||
| <70 años = 57 57 | Edad= 75 ± 4.5; Educ= BI-MC; M/F= 56/44 | |||||||
| Mansilla et al. (2012) | Total = 75 | Edad= 5.5-13.5= ; Educ= 9.5 ± 2.3 ; M/F= 55/45 | Concurrente | Norma chilena del test No se encontraron diferencias estadísticamente significativas | ||||
| VFT | Olabarrieta-Landa et al., (2015a) | Total= 387 | Edad= 11.5±3.5 ; EMP=12.3±3.0 ; M/M=50/50 | Sí | ||||
| Olabarrieta-Landa et al. (2017) | Total=320 | Edad= 55.1±19.6; M/H=58/42 | Sí | |||||
| <12 años educ =241 | ||||||||
| >12 años educ =79 | ||||||||
| WAIS | Rosas et al. (2014) | Total =887 | Edad=39.2±20.1; Educ=8-17 | Consistencia interna Test-retest | [u]α[/u] de Cronbach = 0.941 | Contenido | Evaluación de expertos Adecuada | Sí |
| Constructo | Estructura de correlaciones Matriz de correlaciones se adecua a lo esperado teóricamente | |||||||
| Análisis factorial confirmatorio Niveles buenos o aceptables para una estructura de 4 factores | ||||||||
| Concurrente | Prueba de inteligencia fluida - forma A r=0.79, p<0,001 | |||||||
| Prueba de inteligencia fluida - forma B r=0.82, p<0.001 |
Nota. M/H= mujer / hombre; M/F=Masculino/ Femenino. Educ= educación; EMP = Educación Media de los Padres. B = Análisis factorial confirmatorio; DCL = Deterioro cognitivo leve; DCM = Deterioro cognitivo medio; DCMay = Deterioro cognitivo mayor; A = Tipo Amnésico; NA = Tipo No amnésico; TA = Tipo Alzheimer.
Por otro lado, en cuanto a la validez, el total de los estudios incorpora esta variable. Siete estudios utilizaron validez convergente, y dos de estos lo hicieron en combinación con validez divergente (Tabla 5). Cinco estudios incorporaron la validez predictiva, dos la validez de constructo y uno la validez de contenido (Tabla 5).
Evaluación de la Calidad de la Validación
El instrumento utilizado para evaluar la calidad de la validación de los instrumentos fue el Cognitive Screening Standardization Checklist, CSSC (Aiello et al., 2022). Como se señaló previamente, este entrega puntajes absolutos que van de 0-13 en la escala de evaluación de muestreo y de 0-29 en la escala de evaluación del proceso de validación, dando un total de 42 puntos. Aquí, los resultados se presentan desagregados en la Tabla 6 y se informan mediante porcentaje de logro en torno al máximo de cada escala. Así, si un estudio obtuvo 10 puntos de 13 en la escala de evaluación de muestreo, se señalará que obtuvo un 76% de logro en tal escala.
Tabla 6 Evaluación de la calidad de cada estudio de validación según el Cognitive Screening Standardization Checklist
| Muestreo (CSSC-S) | Alarcón et al. (2012) | Mansilla et al. (2012) | Muñoz-Neira et al. (2012) | Rosas et al. (2014) | Olabarrieta-Landa et al., (2015a) | Olabarrieta-Landa et al., (2015b) | Rivera et al. (2015) | Delgado et al. (2016) | Arango-Lasprilla et al., (2017) | Musa et al. (2017) | Olabarrieta-Landa et al. (2017) | Delgado et al. (2019) | Bello-Lepe et al. (2020) | Cancino et al. (2020) |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ¿Se reportan los datos demográficos de la muestra? | ||||||||||||||
| Se informa de la edad, la educación y el sexo (1) | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
| ≥ Falta 1 característica(s) (edad, educación o sexo) (0) | ||||||||||||||
| ¿Se describen adecuadamente los datos demográficos de la muestra? | ||||||||||||||
| Los continuos (por ejemplo, edad y educación) reportados como M ± DE y rango; los categóricos como frecuencias/porcentajes (por ejemplo, sexo) (1) | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |||
| ≥ 1 estadísticas no comunicadas (0) | 0 | 0 | 0 | |||||||||||
| ¿El tamaño de la(s) muestra(s) normativa(s) es/son adecuado(s)? | ||||||||||||||
| N≥300 (2) | 2 | 2 | 2 | 2 | 2 | 2 | ||||||||
| 150≤N<300 (1) | 1 | 1 | 1 | |||||||||||
| N<150 (0) | 0 | 0 | 0 | 0 | 0 | |||||||||
| ¿Es/son la(s) muestra(s) normativa(s) geográficamente representativa(s)? | ||||||||||||||
| Al menos 3 regiones diferentes con una cobertura geográfica aceptable (por ejemplo, norte, centro y sur) (2) Al menos 2 regiones diferentes con una cobertura geográfica aceptable (por ejemplo, Norte y Sur) (1) | 2 | 2 | ||||||||||||
| Una sola región (0) | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ||
| La(s) muestra(s) normativa(s) cubre(n) un rango suficientemente amplio de edad adulta? | ||||||||||||||
| Rango ≥ 50 (2) | 2 | 2 | 2 | 2 | ||||||||||
| 30≤rango<50 (1) | 1 | |||||||||||||
| Rango< 30 (0) | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |||||
| ¿Es/son la(s) muestra(s) normativa(s) representativa(s) de todos los niveles educativos? | ||||||||||||||
| Rango ≥ 13 (2) | 2 | 2 | ||||||||||||
| 10≤rango<13 (1) | 1 | 1 | 1 | 1 | 1 | 1 | ||||||||
| Rango < 10 (0) | 0 | 0 | 0 | 0 | 0 | 0 | ||||||||
| ¿Es/son adecuada(s) la(s) estratificación(es) de la(s) muestra(s) normativa(s) (por edad, educación y sexo)? | ||||||||||||||
| Todas las celdas de co-ocurrencia que incluyen al menos 1 observación (2) | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | ||||
| La mayoría de las celdas que incluyen al menos 1 observación, excepto las “críticas” (por ejemplo, edad joven con bajo nivel educativo) (1) | ||||||||||||||
| Patrones claramente desequilibrados detectables dentro de la estratificación de la tabla (0) | 0 | 0 | 0 | 0 | ||||||||||
| ¿La(s) muestra(s) normativa(s) está(n) bien equilibrada(s) entre hombres y mujeres (40 y 60% o 50-50% circa, respectivamente)? (1) | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |||||
| ¿Se describen adecuadamente los criterios de exclusión de la(s) muestra(s) normativa(s)? | ||||||||||||||
| Cuantitativos (por ejemplo, puntuaciones de corte en una prueba) y cualitativos (condiciones premórbidas suficientemente descritas, por ejemplo, subdivisión en clasificaciones médicas) (2) | 2 | |||||||||||||
| Una de cada (cuantitativa o cualitativa bien descrita) (1) | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | ||||
| Sólo cualitativo y no suficientemente descrito (0) | 0 | 0 | 0 | |||||||||||
| Puntaje CSSC-S en porcentaje | 23,1 | 30,8 | 46,2 | 100,0 | 84,6 | 84,6 | 76,9 | 38,5 | 69,2 | 23,1 | 69,2 | 46,2 | 61,5 | 30,8 |
| Psicometría, diagnóstico y usabilidad (CSSC-PDU) | ||||||||||||||
| ¿Es adecuada la adaptación lingüística? | ||||||||||||||
| Traducción inversa/no necesaria (instrumento de novo) (2) | ||||||||||||||
| Traducción simple con controles adecuados de los sesgos de subjetividad (por ejemplo, jueces independientes) (1) | 1 | 1 | ||||||||||||
| Traducción simple solamente (0) | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ||
| ¿Es adecuada la adaptación transcultural (si es necesaria)? | ||||||||||||||
| Puntos críticos tratados adecuadamente/no necesarios (1) Puntos críticos no tratados adecuadamente (0) | 1 | 1 | 1 | 1 | 1 | 0 | 1 | 0 | 1 | 0 | 1 | 1 | 1 | 0 |
| ¿Existen pruebas de aceptabilidad? (1 en caso afirmativo) | ||||||||||||||
| ¿Se ha comprobado la validez? (1 en caso afirmativo) | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
| En caso afirmativo, ¿cuáles de las siguientes medidas de validez se han tenido en cuenta? (1 en caso afirmativo) | > | > | > | > | > | > | > | |||||||
| Validez convergente | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |||||||
| Validez divergente | 1 | 1 | ||||||||||||
| Validez de criterio | ||||||||||||||
| Validez ecológica | ||||||||||||||
| Técnicas de reducción de la dimensionalidad Otras medidas de validez | 1 | 1 | 1 | 1 | 1 | 1 | ||||||||
| Si se ha comprobado la validez convergente: ¿la(s) medida(s) correlacional(es) es(son) adecuada(s) (se dirige(n) al mismo constructo)? (1 en caso afirmativo) | > | > | 1 | > | > | 1 | > | 1 | > | 1 | >1 | |||
| ¿Se ha comprobado la fiabilidad? (1 en caso afirmativo) | > | >1 | 1 | > | > | 1 | > | 1 | > | 1 | >1 | 1 | ||
| En caso afirmativo, ¿cuál de las siguientes medidas de fiabilidad se ha tenido en cuenta? (1 en caso afirmativo) Fiabilidad entre evaluadores | > | > | > | > | > | > | > | |||||||
| Fiabilidad test-retest | 1 | |||||||||||||
| Coherencia interna | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |||||||
| Formas paralelas/medidas de cambio significativo | ||||||||||||||
| ¿Se ha comprobado la sensibilidad? (1 en caso afirmativo) | > | >1 | > | > | 1 | > | > | 1 | >1 | |||||
| ¿Se ha comprobado la especificidad? (1 en caso afirmativo) | > | >1 | > | > | 1 | > | > | 1 | >1 | |||||
| ¿Existen métricas derivadas de la sensibilidad y la especificidad? (por ejemplo, VPP) (1 en caso afirmativo) | > | >1 | > | > | 1 | > | > | 1 | >1 | |||||
| ¿Se informa de la precisión (por ejemplo, AUC)? (1 en caso afirmativo) | > | >1 | > | > | > | > | 1 | >1 | ||||||
| Si se han realizado análisis ROC (1 en caso afirmativo) | > | >1 | > | > | 1 | > | > | 1 | >1 | |||||
| ¿se ha identificado el valor de corte con un procedimiento descrito explícitamente (por ejemplo, índice de Youden)? | 1 | 1 | ||||||||||||
| ¿se ha identificado adecuadamente la condición diana? | ||||||||||||||
| Cuantitativo (por ejemplo, puntuaciones de corte en una prueba) | 1 | 1 | 1 | 1 | 1 | |||||||||
| Cualitativa (por ejemplo, criterios clínicos) | ||||||||||||||
| ¿Se ha realizado un estudio normativo? (1 en caso afirmativo) | > | > | 1 | >1 | >1 | 1 | > | 1 | > | 1 | > | |||
| En caso afirmativo | > | > | > | > | > | > | > | |||||||
| ¿Se ha adoptado un enfoque basado en la regresión? | 1 | 1 | 1 | 1 | 1 | 1 | ||||||||
| ¿Se ha adoptado un control del error inferencial en la derivación de valores normativos? | 1 | 1 | 1 | 1 | 1 | 1 | ||||||||
| ¿Se han investigado los efectos del techo/suelo? | ||||||||||||||
| ¿El enfoque adoptado cumple los supuestos de distribución (por ejemplo, distribución gaussiana)? (0 en caso afirmativo) | ||||||||||||||
| Puntaje CSSC-PDU en porcentaje | >10,3 | 10,3 | >48,3 | 41,4 | >20,7 | 17,2 | >20,7 | 41,4 | >20,7 | 17,2 | >20,7 | 51,7 | >44,8 | 13,8 |
En relación con la escala de evaluación de la muestra, el puntaje más alto lo obtiene la validación de WAIS-IV (Rosas et al., 2014) con un 100%. En segundo, tercer y cuarto lugar se encuentran los estudios del grupo multicéntrico dirigido por Arango-Lasprilla, con un 84.6% para los estudios de BNT y VFT (Olabarrieta-Landa et al., 2015a, 2015b); un 76,9% para FCRO (Rivera et al., 2015), y; un 61,5% para ROCF y VFT en niños/as (Arango-Lasprilla et al., 2017a; Olabarrieta-Landa et al., 2017). También en cuarto lugar, se encuentra el estudio de MOCA de Bello-Lepe et al. (2020).
Luego, con un puntaje obtenido menor al 50% en la escala de calidad de la muestra, se encuentran en orden decreciente los estudios de MOCA y ACE-R con 46.2% (Delgado et al., 2019; Muñoz-Neira et al., 2012); FCSRT con un 38.5% (Delgado et al., 2016); ACE-R, MMSE, MOCA (Cancino et al., 2020) y RPM (Mansilla et al., 2012) con 30.8%, finalmente; se encuentran los estudios de NPI-Q (Musa et al., 2017) y RPM (Alarcón et al., 2012) con un 23,1%.
Dentro de los resultados más bajos por ítem destaca que en su mayoría los estudios tienen una muestra de personas de solo una región geográfica y con un rango de edades menor a 30 años (Tabla 6).
Por otro lado, en cuanto a la evaluación de la calidad del proceso de validación, solo un estudio obtuvo sobre la mitad del puntaje total, a saber, el estudio de MOCA de Delgado et al. (2019) con 51,7%. Le siguen el estudio de ACER de Muñoz-Neira et al. (2012) con un 48,3% del puntaje, la validación de MOCA (Bello-Lepe et al., 2020) con un 44,8% y, en cuarto lugar, los estudios de FCRST (Delgado et al., 2016) y WAIS-IV (Rosas et al., 2014) con un 41,4%. Luego, en orden decreciente, le siguen los estudios de ROCF (Arango-Lasprilla et al., 2017ª; Rivera et al., 2015) y VFT (Olabarrieta-Landa et al., 2015a, 2017) con un 20.7%; NPI-Q (Musa et al., 2017) y BNT (Olabarrieta-Landa et al., 2015b) con un 17.2%; ACE-R, MMSE, MOCA (Cancino et al., 2020) con un 13.8%, y; RPM (Alarcón et al., 2012; Mansilla et al., 2012) con un 10.3% del puntaje total obtenible en la subescala de proceso de validación.
5. DISCUSIÓN
El presente trabajo busca conocer la evidencia de validez de los instrumentos de evaluación neuropsicológica ofrecidos por el sistema público de salud de Chile, o FONASA. En total FONASA ofrece 21 instrumentos de evaluación neuropsicológica, y en esta revisión se encontró evidencia solo para 10 de ellos, en un total de 14 artículos comprendidos entre el año 2012 y 2020.
Los instrumentos que cuentan con estudios en Chile son ACE-R, BNT, FCRST, MMSE, MOCA, NPI-Q, ROCF, RPM, VFT y WAIS-IV. En su conjunto los instrumentos abordan las siguientes áreas cognitivas: capacidad intelectual (Alarcón et al., 2012; Mansilla et al., 2012; Rosas et al., 2014), aspectos cognitivos generales asociados con el tamizaje de trastornos cognitivos y demencias (Bello-Lepe et al., 2020; Cancino et al., 2020; Delgado et al., 2016; Delgado et al., 2019; Muñoz-Neira, et al., 2012; Musa et al., 2017), funcionamiento ejecutivo y lenguaje (Olabarrieta-Landa et al., 2015b), funcionamiento ejecutivo y percepción visual (Arango-Lasprilla et al., 2017a; Rivera et al., 2015), y; desarrollo o trastornos del lenguaje (Olabarrieta-Landa et al., 2015a).
La calidad de la evidencia acerca de los estudios fue analizada a través del instrumento CSSC (Aiello et al., 2022) y se encontró una alta variabilidad entre los estudios en términos de control de variables, uso de estadísticos descriptivos e inferenciales. Así, es posible encontrar estudios con un puntaje perfecto en cuanto a la selección de la muestra (p.e. la validación de WAIS-IV) mientras que en el extremo inferior hay estudios con puntajes menores al 25% del puntaje total de la escala. Por otro lado, en términos psicométricos, de utilidad diagnóstica y usabilidad hay estudios que superan el 50% del puntaje máximo obtenible mientras que otros rondan el 10% del estándar.
A lo anterior se suma, que los estudios no son representativos para todas las poblaciones en la medida en que se centran en población urbana, en su mayoría de la zona central/metropolitana del país y predominantemente en población adulta mayor.
En resumen, se puede señalar que el sistema de salud público de Chile ofrece prestaciones que no cuentan con estudios de validación para 11 de sus pruebas, y que de las 10 restantes la calidad es variable y circunscrita a ciertos grupos poblacionales.
Los resultados aquí obtenidos no sorprenden en relación con lo señalado por otros autores, respecto de que en Latinoamérica la neuropsicología ha tenido un desarrollo tardío en relación con otros lugares del mundo y que hasta el día de hoy se cuenta con relativamente pocos instrumentos de evaluación validados (Arango-Lasprilla, 2015). Siguiendo esta línea, en una encuesta realizada a 808 neuropsicólogos/as latinoamericanos/as en 2013-2014, la mayoría indicaba que una de las limitantes de la disciplina es la falta de instrumentos válidos para la población de los países en los que trabajaban (Arango-Lasprilla et al., 2017b).
Considerando lo anterior, se podría entender la carencia de estudios normativos para al menos la mitad de las pruebas ofrecidas por el sistema público chileno, como parte de la realidad latinoamericana. La inclusión de pruebas sin estandarización y validación nacional podría responder a una necesidad real y creciente, sin embargo, también debe reconocerse que el diagnóstico de personas con instrumentos no validados es reconocido como una de las faltas más comunes a la ética dentro de la realidad latinoamericana y que compromete la interpretación de los datos, el diagnóstico y decisiones terapéuticas (Panyavin et al., 2015). Por ejemplo, Daugherty et al. (2017) reportaron un error del 20% en el diagnóstico de personas hispanoparlantes (españoles y colombianos) mediante pruebas validadas para población angloparlante estadounidense. Más aún, como muestran los estudios de esta revisión, es posible encontrar diferencias normativas para un mismo test en distintos países de latinoamérica (Arango-Lasprilla et al., 2017a; Olabarrieta-Landa et al., 2015a, 2015b, 2017; Rivera et al., 2015). A pesar de que esta revisión no contó con estudios interculturales dentro de Chile, se podría hipotetizar que, si existen diferencias, según lo señalado por la literatura en otros países (Irani, 2022; Rabin et al., 2020).
En el presente estudio hemos detectado la necesidad de seguir profundizando e implementando instrumentos adaptados a las diversas realidades culturales, sociales y demográficas. Permitiendo a los profesionales de la salud apoyar de mejor manera en procesos de evaluación e intervención neuropsicológica. Es por esta razón que planteamos la necesidad de que la comunidad académica aporte y apoye en la correcta adaptación, publicación y distribución de los diversos instrumentos utilizados por los profesionales de la salud. Esto debe transformarse en una prioridad para los equipos de investigación. Mientras estos trabajos empíricos no sean llevados a cabo y debidamente divulgados en los servicios de salud y atención a pacientes, nuestros resultados sugieren la necesidad de cuestionar y repensar los procesos de evaluación, considerando cautelosamente los resultados obtenidos con instrumentos no traducidos, adaptados y validados adecuadamente. Es por eso que la interpretación de los resultados obtenidos y las decisiones clínicas que se toman con esos resultados, deben ser cuidadosamente examinadas. Esto es de sobre manera relevante cuando se considera que las evaluaciones son implementadas en la amplia población que las requiere, que incluye personas con daño cerebral adquirido, trastornos del desarrollo, diversos trastornos neurológicos, personas mayores, entre otras.
La evidencia indica que diversas medidas neuropsicológicas de amplio uso internacional no tienen una precisión diagnóstica aceptable cuando se utilizan entre personas que no son caucásicas, bien educadas, de habla inglesa nativa y de clase media a alta (Boone et al. 2007; Brickman et al., 2006; Loewenstein et al., 1994; Manly, 2005). Estos aspectos cobran relevancia, debido a las condiciones de diversas de la población latinoamericana, por ejemplo en Chile los años de educación se modifican según los niveles de ingresos. Así, las personas ubicadas en el quintil de menor ingresos tienen un promedio de 9.8 años de escolaridad en comparación con el quintil superior que tiene un promedio de 15 años. Otros aspectos que modifican este factor son la edad de los participantes y vivir en zonas rurales. Por ejemplo, las personas que viven en zonas rurales en Chile tienen 9.7 años de estudio en promedio versus los 11.9 de personas que viven en zonas urbanas (Ministerio de Desarrollo Social y de Familia de Chile, 2021). Por otro lado, el Código de Ética de la Asociación Estadounidense de Psicología (Universidad de Buenos Aires, 2010) establece que no es ético usar medidas inapropiadas entre individuos culturalmente diferentes.
6. CONCLUSIÓN
La mitad de los instrumentos de evaluaciones neuropsicológicas incluidos en el Fondo Nacional de Salud de Chile (FONASA) han sido validados en población chilena. Por otro lado, los instrumentos que presentan validaciones tienen una alta variabilidad de calidad entre los estudios en términos de control de variables, uso de estadísticos descriptivos e inferenciales, no logrando ser representativos a la diversidad geográfica, socioeconómica y etarias de la población chilena. Por tanto, se requiere seguir trabajando en la validación de instrumentos atingentes a las necesidades poblacionales.













