PHQ / GAD (Puntos de Corte)

¿Qué es la sensibilidad y especificidad de una prueba psicológica? La sensibilidad de una prueba se refiere a su capacidad para detectar de manera precisa a las personas que realmente tienen la condición o característica que está siendo evaluada por la prueba. Por ejemplo, qué tanto una prueba que evalúa síntomas depresivos (v.g., PHQ-9) realmente detecta a personas con una condición genuina de depresión. La especificidad se refiere a su capacidad para identificar de manera precisa a las personas que no tienen la condición o característica que está siendo evaluada. En el mismo ejemplo, cuando el PHQ-9 indica que “no habría riesgo de depresión”, qué tanto se puede confiar en dicha aseveración. Como se puede notar, para definir sensibilidad/especificidad de una prueba se necesita contratastarla contra algún criterio externo válido o “gold standard” (v.g., en el caso del PHQ-9 y la depresión, el gold standard suele ser la evaluación clínica/psiquiátrica del paciente).

¿Qué es un punto de corte? Dado el puntaje crudo de una prueba psicológica, es necesario definir uno o más puntos de corte -de dicho puntaje- que faciliten su interpretación substantiva o clínica. Una forma de definir el “punto de corte óptimo” de dicho puntaje crudo es detectar un valor -en la escala del puntaje crudo- en el que la sensibilidad/especificidad estén balanceadas. Por ejemplo, para el caso del PHQ-9, una vez que se suman los valores de las respuestas a los ítems (puntaje crudo), es necesario saber desde qué valor de dicho puntaje sumado se puede decir que la prsona tiene un riesgo de estar pasando por una depresión real. Esto fue lo que hicimos en el estudio de Villarreal-Zegarra et al (2023).

¿Por qué el PHQ y el GAD y cuántas versiones se estudiaron? Las pruebas de screening, como el PHQ y el GAD, permiten la identificación de personas con riesgo de padecer depresión, antes de ser sometidas a una evaluación clínica completa. El uso de estas pruebas deriva en la reducción de costos y carga de enfermedad al ayudara a una detección oportuna de las personas con riesgo real. Alrededor del mundo se utilizan diversas pruebas de este tipo; sin embargo, en el Perú sólo se han validado el PHQ y el GAD, por eso las elegimos. Hasta antes de realizarse esta investigación (Villarreal-Zegarra et al. 2023), no se contaba con estudios sobre calibración de puntos de corte para ninguna de las versiones de ambas pruebas. Así, en nuestro estudio logramos establecer los puntos de corte óptimos para el PHQ, en sus formas PHQ-9, PHQ-8 y PHQ-2, y el GAD en su forma GAD-7 y GAD-2, teniendo como referencia a una población clínica peruana.

¿Cuáles son los puntos de corte recomendados para la pacientes peruanos? Para determinar los puntos de corte en el estudio de Villarreal-Zegarra et al. 2023, se utilizó como gold standard una entrevista clínica psiquiátrica según los criterios diagnósticos del CIE-10. La entrevista se enfocó en evaluar si los participantes tenían trastornos depresivos (F32.0, F32.1, F32.2 and F32.3) o trastornos ansiosos (F41.0 y F41.1), para el PHQ y el GAD respectivamente. Así, determinamos que el punto de corte ≥7 es óptimo para detectar casos de depresión con el PHQ-9, tras mostrar la mayor sensibilidad y especificidad simultáneas al contrastarse con el diagnóstico psiquiátrico . Otros puntos de corte óptimos fueron: ≥7 para el PHQ-8 y ≥2 para el PHQ-2. Para el GAD-7, el punto de corte ≥8 tuvo un buen rendimiento con sensibilidad y especificidad, y el punto de corte ≥10 tuvo en comparación niveles más bajos de sensibilidad pero niveles más altos de especificidad. Los detalles técnicos de cómo obtuvimos estos puntos de corte los puedes ver en nuestra publicación (Villarreal-Zegarra et al. 2023).

¿Qué cuidados debo tener al usar estos puntos de corte? Primero, recuerda siempre que las pruebas de screening como el PHQ o el GAD no reemplazan a la evaluación clínica psiquiátrica del especialista. Luego, debes tener presente que nuestro estudio (Villarreal-Zegarra et al. 2023) fue realizado en una población clínica específica (i.e., un hospital de Lima) y es más o menos representativo de poblaciones peruanas similares (i.e., peruanos atendidos en hospitales similares). En otras palabras, no hay una representatividad poblacional a nivel Perú en un sentido formal. No obstante, la nuestra es la mejor opción disponible, teniendo en cuenta que estudios poblacionales de corte clínico como éste no suelen/pueden hacerse en Perú con regularidad (y en muchos otros países), por razones logística y de costos. Finalmente, dadas las características de nuestra muestra, podemos decir que los puntos de corte para el PHQ son robustos, mientras que los del GAD son provisionales.

¿Como citar nuestro trabajo?
Villarreal-Zegarra D, Barrera-Begazo J, Otazú-Alfaro S, Mayo-Puchoc N, Bazo- Alvarez JC, Huarcaya-Victoria J. Sensitivity and specificity of the Patient Health Questionnaire (PHQ-9, PHQ-8, PHQ-2) and General Anxiety Disorder scale (GAD-7, GAD-2) for depression and anxiety diagnosis: a cross-sectional study in a Peruvian hospital population. BMJ Open. 2023 Sep 15;13(9):e076193. doi: 10.1136/bmjopen- 2023-076193. PMID: 37714674; PMCID: PMC10510859.

Recuerda: puedes escribirnos para hacernos preguntas no contestadas en esta página o en el artículo de Villareal-Zegarra et al., 2023. Estaremos encantados de responderte.

(El contenido de esta página ha sido elaborado por Juan Barrera y editado por Juan Carlos Bazo, miembros de PSYCOPERU. Todos los derechos reservados. El acceso a este contenido es libre, pero su uso con fines comerciales está prohibido)