Paradoja de Simpson

Los cálculos renales y la paradoja de Simpson

Algo hemos hablado de la paradoja de Simpson en un artículo de LinkedIn (https://www.linkedin.com/pulse/interprentado-voy-juan-francisco-vallalta/) en el que describíamos el caso de la apendicectomía beneficiosa.

Hoy quiero hablaros con más detalle de este curioso fenómeno estadístico conocido como la paradoja de Simpson.

En 1986, un grupo de urólogos en Londres publicó un artículo de investigación en The British Medical Journal que comparó la efectividad de dos métodos diferentes para eliminar los cálculos renales. El tratamiento A fue cirugía abierta (invasiva) y el tratamiento B fue nefrolitotomía percutánea (menos invasiva).

Cuando observaron los resultados de 700 pacientes, el tratamiento B tuvo una mayor tasa de éxito. Sin embargo, cuando solo observaron el subgrupo de pacientes con diferentes tamaños de cálculos renales, el tratamiento A tuvo una mejor tasa de éxito. ¿Qué está pasando aquí?

Este conocido fenómeno estadístico se llama la paradoja de Simpon. La paradoja de Simpon ocurre cuando las tendencias aparecen en los subgrupos pero desaparecen o se invierten cuando se combinan los subgrupos.

En este post, vamos a explorar la paradoja de Simpon usando la regresión múltiple y otras herramientas estadísticas.

Partiremos de un dataset que refleja el tipo de tratamiento que se aplicó, el tamaño del cálculo y sí el tratamiento fue un éxito o no:

Dataset

A continuación calcularemos la frecuencia de éxito de cada tratamiento sin considerar el tamaño del cálculo:

Tasa de éxito de los tratamientos sin considerar tamaño del cálculo

Observamos que el tratamiento B tiene una tasa de éxito del 82% frente al tratamiento A con una tasa de éxito del 78%.

A continuación vamos a considerar el tamaño del cálculo. Vamos  a dividir los cálculos en dos categorías por su tamaño: pequeños y grandes. Agrupando los datos para calcular la frecuencia de éxito considerando el tamaño del cálculo obtenemos:

Tasa de éxito de los tratamientos considerando el tamaño del cálculo

¿Qué está sucediendo? Cuando consideramos el tamaño del cálculo el tratamiento A tiene mejor tasas de éxito que el tratamiento B, tanto para los cálculos grandes como para los pequeños.

Veamos cómo se distribuyen los cálculos según su tamaño en los dos tratamientos. De la figura se observa que la distribución no está equilibrada. Para el tratamiento A la mayoría de los cálculos son grandes, mientras que para el tratamiento B la mayoría de los cálculos son pequeños.

Distribución del tamaño del cálculo por tratamiento.

Vamos a analizar la asociación entre el tamaño del cálculo y el tipo de tratamiento mediante un test Chi-Cuadrado:

Test Chi-Cuadrado tamaño del cálculo y tratamiento.

Los resultados anteriores nos muestran que el tamaño del cálculo es una variable de confusión en el estudio que estamos realizando sobre la efectividad del tratamiento.

Afortunadamente hay formas de evitar el efecto de una variable de confusión. Vamos a construir un modelo de regresión logística que tiene como resultado el éxito del tratamiento y como variables explicativas el tamaño del cálculo y el tratamiento:

Modelo de regresión logística

Se consideran p-valor por debajo de 0.05 como significativo. Otra forma de evaluar si existe una relación significativa es calcular el intervalo con un nivel de confianza del 95%. Evaluaremos si:

  1. El efecto de un cálculo pequeño es el mismo que el de un cálculo grande.
  2. Si el tratamiento A es tan efectivo como el tratamiento B.

Si el intervalo de confianza de cada coeficiente estimado pasa por cero no podremos concluir que exista una diferencia entre uno y otro. De otra forma podremos concluir que existen diferencias significativas. Realizaremos una representación del CI para cada variable:

Intervalos de confianza de los coeficientes del modelo.

De la representación gráfica se obtiene que es más probable que un cálculo pequeño sea tratado exitosamente, pero que no existe certeza que en general el tratamiento B sea más eficaz que el A.

Así que hay que ser muy cauto con las interpretaciones y mirar y remirar los resultados antes de extraer conclusiones.

Contacta conmigo sí necesitas ayuda para aplicar análisis y minería de datos en tu investigación o proyecto: https://healthdataminer.com/contacto/