Icon

JKISeason2-2 Ángel Molina

There has been no description set for this workflow's metadata.

Challenge 2: Segmentación de usuarios de tarjetas de créditoNivel: MedioDescripción: La empresa de tarjetas de crédito ABC mantiene información sobre las comprasy los pagos de los clientes. La información está disponible para clientes individuales comoInformación de Pagos e Información de Compras. La empresa desea segmentar a los clientesen tres (3) clusters, de modo que puedan diseñarse campañas de marketing en función decada cluster. Se le pide que utilice ambas informaciones para construir un modelo deagrupación que segmente adecuadamente a los clientes. ¿Qué patrones tienen en común losclientes de un mismo cluster? Además, se dispone de información sobre los clientes reciénregistrados. Se le pide que asigne etiquetas de cluster a los clientes recién registradosutilizando el modelo de clustering entrenado, y que luego exporte los resultados a un archivoCSV. ¿Tienen sentido las asignaciones? ¿Cómo evalúa su calidad? SOLUCION: Para afrontar este reto, empezamos dividiendo los datos en clientes existentes y nuevos. A continuación, preprocesamos los datos de los clientes existentes para corregir losvalores que faltan y normalizarlos, lo que facilita su agrupación posterior. A continuación, utilizamos k-Means para identificar tres (k = 3) clusters en estos datos, cuya calidad evaluamoscalculando el coeficiente Silhouette (el valor se aproximaba bastante a 1, por lo que los clusters tenían una calidad aceptable). También visualizamos los conglomerados identificadoscon un gráfico de dispersión. Por último, asignamos los ID de cluster identificados a los nuevos clientes, agrupándolos también.La agrupación fue útil para segmentar a los clientes en categorías de perfil bajo (Cluster_1, con usuarios que han realizado pagos de pedidos bajos y pocas compras); potencial(Cluster_0, con usuarios que han realizado pagos de pedidos medios a altos pero un número relativamente bajo de compras); y premium (Cluster_2, con usuarios que han realizadopagos de pedidos altos y un número elevado de compras). Las campañas de marketing podrían centrarse en estas categorías para aumentar los ingresos. K-means es un algoritmo de clasificaciónno supervisada (clusterización) queagrupa objetos en k grupos basándoseen sus características Normalizamos compas y pagosEste nodo genera los cluster para un número predefinidoAsignamos colorCreamos archivo CSVCorregimos valores que falta: los stringcon el valor mas frecuente, y los numeros con unainterpolacion lineal Igual que antescargamos el archivo CSVDividimos clientes existentes y nuevosGráfica del resultado del cofecienteEste nodo calcula el Coeficiente de Silhouette para el resultado de clustering proporcionadoDesnormalizamos para graficarGráfica de los cluster Normalizer k-Means Cluster Assigner Color Manager CSV Writer Normalizer (Apply) Missing Value Missing Value(Apply) CSV Reader Partitioning Bar Chart(JavaScript) SilhouetteCoefficient Denormalizer Scatter Plot(JavaScript) Challenge 2: Segmentación de usuarios de tarjetas de créditoNivel: MedioDescripción: La empresa de tarjetas de crédito ABC mantiene información sobre las comprasy los pagos de los clientes. La información está disponible para clientes individuales comoInformación de Pagos e Información de Compras. La empresa desea segmentar a los clientesen tres (3) clusters, de modo que puedan diseñarse campañas de marketing en función decada cluster. Se le pide que utilice ambas informaciones para construir un modelo deagrupación que segmente adecuadamente a los clientes. ¿Qué patrones tienen en común losclientes de un mismo cluster? Además, se dispone de información sobre los clientes reciénregistrados. Se le pide que asigne etiquetas de cluster a los clientes recién registradosutilizando el modelo de clustering entrenado, y que luego exporte los resultados a un archivoCSV. ¿Tienen sentido las asignaciones? ¿Cómo evalúa su calidad? SOLUCION: Para afrontar este reto, empezamos dividiendo los datos en clientes existentes y nuevos. A continuación, preprocesamos los datos de los clientes existentes para corregir losvalores que faltan y normalizarlos, lo que facilita su agrupación posterior. A continuación, utilizamos k-Means para identificar tres (k = 3) clusters en estos datos, cuya calidad evaluamoscalculando el coeficiente Silhouette (el valor se aproximaba bastante a 1, por lo que los clusters tenían una calidad aceptable). También visualizamos los conglomerados identificadoscon un gráfico de dispersión. Por último, asignamos los ID de cluster identificados a los nuevos clientes, agrupándolos también.La agrupación fue útil para segmentar a los clientes en categorías de perfil bajo (Cluster_1, con usuarios que han realizado pagos de pedidos bajos y pocas compras); potencial(Cluster_0, con usuarios que han realizado pagos de pedidos medios a altos pero un número relativamente bajo de compras); y premium (Cluster_2, con usuarios que han realizadopagos de pedidos altos y un número elevado de compras). Las campañas de marketing podrían centrarse en estas categorías para aumentar los ingresos. K-means es un algoritmo de clasificaciónno supervisada (clusterización) queagrupa objetos en k grupos basándoseen sus características Normalizamos compas y pagosEste nodo genera los cluster para un número predefinidoAsignamos colorCreamos archivo CSVCorregimos valores que falta: los stringcon el valor mas frecuente, y los numeros con unainterpolacion lineal Igual que antescargamos el archivo CSVDividimos clientes existentes y nuevosGráfica del resultado del cofecienteEste nodo calcula el Coeficiente de Silhouette para el resultado de clustering proporcionadoDesnormalizamos para graficarGráfica de los cluster Normalizer k-Means Cluster Assigner Color Manager CSV Writer Normalizer (Apply) Missing Value Missing Value(Apply) CSV Reader Partitioning Bar Chart(JavaScript) SilhouetteCoefficient Denormalizer Scatter Plot(JavaScript)

Nodes

Extensions

Links