No hay peor augurio del fracaso en una actividad que no empezar con un fin en mente. El análisis y minería de datos no es ajeno a este lema. Antes de iniciar un proyecto de data mining deberías tener clara la respuesta a la pregunta: ¿qué objetivo persigo? ¿cuál es la tarea principal del proyecto?
Objetivos proyecto data mining
Una posible síntesis de los objetivos de un proyecto de minería de datos sería la siguiente:
- Asociación: determinar conjunto de objetos que se dan frecuentemente juntos en el contexto del problema.
- Clustering: segmentar una población de objetos heterogénea en un número de grupos más homogéneos o clústeres.
- Clasificación: consiste en examinar las características de un objeto nuevo y asignarlo a un conjunto finito predefinido de clases.
- Estimación: dado un conjunto de datos de entrada el modelo estima el valor de una magnitud continua desconocida.
- Predicción: dado un conjunto de datos de entrada el modelo estima el valor de una magnitud futura.
- Descripción: describir las características de un conjunto de objetos en forma de asociaciones significativas o causales entre diferentes variables.
- Explicación: determinar las razones de un determinado comportamiento.
A continuación se muestra en un esquema de los objetivos de un proyecto de minería de datos y las posibles técnicas asociadas:
Objetivo | Técnica Minería de Datos |
Asociación | Reglas de asociación. |
Clustering | Detección de cluster. Mapas autoorganizados. |
Clasificación | Reglas de clasificación Árboles de decisión K-NN (K-Nearest Neighbor) Redes neuronales Análisis de enlaces (link analysis) |
Estimación | Árboles de decisión Modelos de regresión Redes neuronales Análisis de supervivencia |
Predicción | Árboles de decisión Modelos de regresión Redes neuronales Series temporales Redes bayesianas |
Descripción | Redes bayesianas Reglas de asociación |
Explicación | Redes bayesianas |