Buscando el clúster
Los algoritmos de clustering se utilizan para agrupar elementos que son similares entre sí. Vamos a explorar si sería interesante utilizar algoritmos de clustering para agrupar pacientes con enfermedad cardiovascular.
Los algoritmos de clustering se utilizan para agrupar elementos que son similares entre sí. Vamos a explorar si sería interesante utilizar algoritmos de clustering para agrupar pacientes con enfermedad cardiovascular.
Las enfermedades cardiovasculares son una de las principales causas de muerte en todo el mundo. En este post vamos a realizar un análisis para estudiar cómo la frecuencia cardiaca máxima que se alcanza durante el ejercicio puede estar vinculada a una mayor probabilidad de contraer enfermedades cardiovasculares.
A principios de la década de 1840 aproximadamente el 10% de las mujeres que daban a luz en el Hospital General de Viene morían por una enfermedad denominada fiebre puerperal. El Dr. Semmelweis descubrió que la causa de la enfermedad eran las manos contaminadas de los médicos. La solución, aunque muy sencilla, fue muy controvertida para la época: ¡lavarse las manos!
La cantidad de algoritmos que se utilizan en minería de datos en enorme y corremos el riesgo de perdernos en un mar de siglas que inicialmente no aportan más que confusión. Una buena forma de aproximarnos será organizarlos en función del tipo de aprendizaje que utilizan: supervisado y no supervisado.
No hay peor augurio del fracaso en una actividad que no empezar con un fin en mente. El análisis y minería de datos no es ajeno a este lema. Antes de iniciar un proyecto de data mining deberías tener clara la respuesta a la pregunta: ¿qué objetivo persigo? ¿cuál es la tarea principal del proyecto? …
Si eres profesional o investigador de una organización de salud estoy seguro de que habrás escuchado o leído más de una vez sobre el potencial del big data en salud. Hoy en día todo el mundo habla de big data, pero es importante situar este concepto en el contexto adecuado pues no toda aproximación al análisis de datos sería big data ni requiere una infraestructura big data.