Análisis de los datos del COVID-19 en España con R (II)

Este artículo es una exploración didáctica de los datos del COVID-19 en España y pretende mostrar las capacidades para el estudio epidemiológico que ofrece R.

En ningún momento se debe considerar como un informe de situación de la epidemia en España. Para ello se recomienda consultar los datos comunicados por el Ministerio de Sanidad.

Modelado de la epidemia de COVID-19 en España

R ofrece funcionalidades para ajustar un modelo SIR a los datos observados de incidencia de COVID-19 en España. Esto nos permite estimar el número básico de reproducción R0 y realizar posibles predicciones sobre la evolución de la epidemia.

Adquisición de datos

Los datos se han obtenido de las notas actualización diaria de enfermedad por SARS-CoV-2 (COVID-19) que publica el Ministerio de Sanidad en su página web. Se ha considerado para este trabajo las notas publicadas a partir del 05 de marzo de 2020 (actualización nº 37) hasta el 16 de marzo de 2020 (actualización nº 46).

Se trata de un resumen epidemiológico de casos confirmados notificados publicado diariamente a las 13:00 horas. A partir del 05 de marzo se incluyen datos detallados por comunidad autónoma.

Análisis de datos exploratorio

Incidencia acumulada diaria

En primer lugar mostraremos el número acumulado de casos confirmados notificados para toda España y para cada una de las comunidades autónomas.

Se observa un crecimiento aproximadamente exponencial típico de la propagación de una epidemia. Si representamos los datos en una escala logarítmica obtenemos una curva de crecimiento  lineal que confirma el crecimiento exponencial.

Incidencia diaria

Los datos proporcionados por el Ministerio de Sanidad son acumulados. Para obtener la curva epidemiológica necesitaremos la incidencia diaria. La calcularemos a partir de los datos acumulados diarios.

Se han filtrado los datos anteriores al día 10/03/2020 pues no se disponía de las notas actualizadas de los días 06/03, 07/03 y 08/03.

Con los datos disponibles a fecha de 16/03/2020 a las  13:00 es muy prematuro emitir cualquier juicio sobre un posible cambio en la evolución de la epidemia. Es necesario esperar a disponer de los datos de los próximos días.

Fallecidos en los casos notificados confirmados

Visualizaremos el número de fallecidos diarios y acumulados en toda España.

Como se observa la tendencia de mortalidad de la epidemia sigue en crecimiento. Se observa un pico de mortalidad el día 15/03/2020.

Ajustando un modelo SIR

Vamos a aplicar un modelo SIR a los datos de la epidemia en España. La idea básica del modelo es dividir a la población en tres grupos: Susceptibles de contraer la enfermedad (S), Infectados por la enfermedad (I) y Recuperados de la enfermedad (R). El modelo viene descrito por un sistema de tres ecuaciones diferenciales que nos permite calcular las tasas de cambio de cada grupo. Viene caracterizado por dos parámetros: uno para la transición S->I y otro para la transición I->R.

Tomaremos como referencia para la población de España el último dato publicado por el INE de 47.100.396 habitantes y los datos de incidencia acumulada publicados por el Ministerio de Sanidad.

El modelo presenta un ajuste aceptable, suficiente para la aproximación didáctica que estamos realizando.  El modelo permite calcular el número básico de reproducción de la epidemia R0. Se obtiene un valor de 2,004. Este número está en consonancia con los valores calculada para COVID-19 y representa el número medio de personas susceptibles que son infectadas por cada persona infectada. Para COVID-19 cada persona infectada transmite la infección a dos personas susceptibles.

Vamos a utilizar nuestro modelo para hacer predicciones sobre la evolución de la epidemia. Estas predicciones se basan en un número básico de reproducción fijo. La realidad es que  gracias a las actuaciones de las autoridades sanitaria como el estado de alarma y la restricción de contacto entre las personas este número es dinámico y menor al teórico calculado. Hablamos de un número básico de reproducción efectivo.

Por tanto, consideremos que no se realizase ninguna actuación de las autoridades sanitarias y la epidemia evolucionase de forma natural.

Si no se realizase ninguna intervención el modelo predice que se infectarán 7.000.000 de personas con un máximo de infectados en torno al 09 de abril de 2020.

Este sencillo modelo nos permite valorar la importancia de las intervenciones de las autoridades sanitarias para mitigar la propagación de la epidemia. Considerando la última tasa de mortalidad de un 3.4% (16/03/2020) proporcionada por el Ministerio de Sanidad estaríamos hablando de 238.000 fallecimientos si no se realizase ninguna intervención.