Análisis de los datos del COVID-19 en España con R (III)

Esta serie de artículos conforman una exploración didáctica de los datos del COVID-19 en España y pretende mostrar las capacidades para el estudio epidemiológico que ofrece R.

En ningún momento se debe considerar como un informe de situación de la epidemia en España. Para ello se recomienda consultar los datos comunicados por el Ministerio de Sanidad y organismos internacionales (ECDC).

Modelado de la epidemia de COVID-19 en España

R ofrece funcionalidades para ajustar un modelo SIR o un modelo logarítmico lineal a los datos observados de incidencia de COVID-19 en España. Esto nos permite estimar el número básico de reproducción R0  o la tasa de crecimiento r y realizar posibles predicciones sobre la evolución de la epidemia.

Adquisición de datos

Los datos se han obtenido de las notas actualización diaria de enfermedad por SARS-CoV-2 (COVID-19) que publica el Ministerio de Sanidad en su página web. Se ha considerado para este trabajo las notas publicadas a partir del 05 de marzo de 2020 (actualización nº 37) hasta el 18 de marzo de 2020 (actualización nº 48).

Se trata de un resumen epidemiológico de casos confirmados notificados publicado diariamente a las 13:00 horas. A partir del 05 de marzo se incluyen datos detallados por comunidad autónoma.

Análisis de datos exploratorio

Incidencia acumulada diaria

En primer lugar mostraremos el número acumulado de casos confirmados notificados para toda España y para cada una de las comunidades autónomas.

Se observa un crecimiento aproximadamente exponencial típico de la propagación de una epidemia. Si representamos los datos en una escala logarítmica obtenemos una curva de crecimiento  lineal que confirma el crecimiento exponencial.

Incidencia diaria

Los datos proporcionados por el Ministerio de Sanidad son acumulados. Para obtener la curva epidemiológica necesitaremos la incidencia diaria. La calcularemos a partir de los datos acumulados diarios.

Se han filtrado los datos anteriores al día 10/03/2020 pues no se disponía de las notas actualizadas de los días 06/03, 07/03 y 08/03.

Con los datos disponibles a fecha de 18/03/2020 (consolidados el día 17/03/2020 a las 21:00 horas) se observa que la epidemia sigue en crecimiento.

A continuación se mostrará la evolución de la incidencia acumulada en las distintas comunidades autónomas:

Las tres comunidades con mayor incidencia de casos son: Madrid, Cataluña y País Vasco. A continuación le siguen Andalucía, Comunidad Valenciana y Castilla La Mancha.

Las comunidades con menor incidencia son: Ceuta, Melilla, Baleares y Cantabria.

Fallecidos en los casos notificados confirmados

Visualizaremos el número de fallecidos diarios y acumulados en toda España.

Como se observa la tendencia de mortalidad de la epidemia sigue en crecimiento.

A continuación mostraremos la evolución del número de fallecimientos acumulado por comunidad autónoma:

Las comunidades con mayor número de fallecimientos son Madrid, Cataluña y País Vasco. Las comunidades de Ceuta, Melilla y Murcia no presentan aún fallecimientos notificados.

Ajustando un modelo logarítmico-lineal

Como hemos visto anteriormente la epidemia en su fase de crecimiento presenta un comportamiento exponencial para la incidencia diaria acumulada. Por lo tanto podríamos ajustar un modelo exponencial a esta fase de la epidemia. O si tomamos el logaritmo de la incidencia acumulada diaria el modelo a ajustar sería un modelo lineal. Este ajuste nos permite calcular la tasa de crecimiento de la epidemia.

Usaremos el paquete incidence de R para el ajuste del modelo.

El modelo nos permite calcular la tasa de crecimiento r = 0,33 (IC 95% 0,30-0,35). Esta tasa de crecimiento es equivalente a un tiempo de duplicación de 2,13 días (IC 95% 1,96-2,33). Es decir cada 2,13 días se  duplica el número de casos si se sigue con esa tasa de crecimiento.

Por hoy lo dejamos. En un próximo post actualizaremos los datos y veremos como el modelo logarítmico lineal nos permite calcular el número de reproducción efectivo de la epidemia.

Te dejo los enlaces a los dos artículos posteriores de esta seria de análisis de COVID-19 en España con R:

Análisis de los datos del COVID-19 en España con R (I)

Análisis de los datos del COVID-19 en España con R (II)