Icon

GMDA_​TPApp_​MD2026_​P2_​Descripciones

Modelo de Clasificación

Se utilizan las variables previamente procesadas (Recency, Frequency, Monetary, Tenure y Tavg) junto con la variable objetivo Churn para entrenar y evaluar distintos modelos de Clasificación.

Modelo de Regresión
Estimación del valor del cliente (Customer Lifetime Value simplificado)

En esta sección se aplican distintos algoritmos de regresión utilizando las variables de comportamiento (Recency, Frequency, Monetary, Tenure y Tavg) con el objetivo de predecir

Modelos Predictivos – Aprendizaje Supervisado
Normalizer
Se generan predicciones de la variable Churn sobre el conjunto de prueba
Random Forest Predictor
Se evalúa el desempeño del modelo y se compara con los demás algoritmos implementados
Scorer
Se analiza la capacidad discriminatoria del modelo mediante la curva ROC
ROC Curve
Normalizer
Se analiza la curva ROC para evaluar la capacidad del modelo de distinguir entre clientes que abandonan y los que permanecen
ROC Curve
Se seleccionan las variables relevantes para el modelado, excluyendo identificadores como CustomerID y conservando las variables explicativas del comportamiento del cliente junto con la variable objetivo a predecir.
Column Filter
Se divide el dataset para entrenamiento y validación del modelo
X-Partitioner
X-Aggregator
Numeric Scorer
Linear Regression Learner
Regression Predictor
Se divide el dataset para entrenamiento y validación del modelo
X-Partitioner
Se divide el dataset en subconjuntos de entrenamiento y prueba mediante validación cruzada, con el objetivo de evaluar la capacidad de generalización del modelo.
X-Partitioner
Excel Reader
Statistics
Histogram
Box Plot
Row Filter
Date&Time Format Manager
Math Formula
Se entrena un modelo de Random Forest para regresión, el cual combina múltiples árboles de decisión para capturar relaciones no lineales entre las variables y mejorar la precisión del modelo
Random Forest Learner (Regression)
Se consolidan los resultados obtenidos en las distintas iteraciones de la validación cruzada
X-Aggregator
Se evalúa el desempeño del modelo mediante métricas como RMSE y R², permitiendo medir el error de predicción y la capacidad explicativa del modelo
Numeric Scorer
Se evalúa el desempeño del modelo mediante métricas como Accuracy y Recall, priorizando la correcta identificación de clientes con churn
Scorer
Se entrena un modelo de regresión polinómica que permite capturar relaciones no lineales entre las variables explicativas y la variable objetivo
Polynomial Regression Learner
Se divide el dataset para entrenamiento y validación del modelo
X-Partitioner
Se generan las predicciones del valor del cliente sobre el conjunto de validación utilizando el modelo entrenado
Regression Predictor
Se agregan los resultados obtenidos en cada iteración de la validación cruzada para obtener métricas globales del modelo
X-Aggregator
Se aplican los modelos entrenados para generar predicciones del valor del cliente sobre el conjunto de validación
Random Forest Predictor (Regression)
Se entrena un modelo KNN que clasifica a los clientes en función de la similitud con sus vecinos más cercanos o similitud de su comportamiento (RFM) respecto a sus vecinos más cercanos, utilizando un K de 8
K Nearest Neighbor
Se divide el dataset para entrenamiento y validación del modelo
X-Partitioner
Se consolidan los resultados de las iteraciones de validación cruzada
X-Aggregator
Se evalúa el rendimiento del modelo mediante métricas de clasificación, poniendo énfasis en el Recall
Scorer
Se entrena un modelo de regresión logística para estimar la probabilidad de que un cliente pertenezca a la clase Churn mediante una función sigmoide
Logistic Regression Learner
Se combinan los resultados obtenidos en cada iteración de la validación cruzada
X-Aggregator
Se generan predicciones de la variable Churn sobre el conjunto de prueba
Logistic Regression Predictor
Se evalúa el rendimiento del modelo mediante métricas de regresión, como RMSE y R².
Numeric Scorer
Se divide el dataset para entrenamiento y validación del modelo
X-Partitioner
Se combinan los resultados de las distintas iteraciones de validación cruzada
X-Aggregator
Se consolidan los resultados obtenidos en la validación cruzada
X-Aggregator
Genera reglas lógicas (if-then) fáciles de interpretar para el negocio.
Decision Tree Learner
Se evalúa el desempeño del modelo mediante métricas como RMSE y R², permitiendo comparar su rendimiento con los demás modelos
Numeric Scorer
Se divide el dataset para entrenamiento y validación del modelo
X-Partitioner
Se analiza la capacidad discriminatoria del modelo mediante la curva ROC
Decision Tree View
GroupBy
Column Filter
Se aplican las reglas del árbol al conjunto de prueba para obtener predicciones.
Decision Tree Predictor
Se entrena un modelo basado en boosting, que construye múltiples árboles de forma secuencial para mejorar progresivamente la precisión del modelo
Gradient Boosted Trees Learner (Regression)
Se evalúa el desempeño del modelo mediante métricas de clasificación
Scorer
Se generan predicciones del valor del cliente sobre el conjunto de validación
Gradient Boosted Trees Predictor (Regression)
Missing Value
Date&Time Difference
Modelo de ensamble que combina múltiples árboles de decisión para mejorar la precisión y evitar el sobreajuste (overfitting)
Random Forest Learner
Numeric Outliers
Math Formula
Se divide el dataset para entrenamiento y validación del modelo
X-Partitioner
Constant Value Column Appender
Se visualizan las predicciones del modelo para analizar la separación entre clases y detectar posibles solapamientos
Scatter Plot
Date&Time Difference
Se asignan colores a las clases para facilitar la visualización de los resultados
Color Manager
Linear Correlation
Heatmap
Rule Engine
Se consolidan los resultados obtenidos en la validación cruzada.
X-Aggregator
Statistics

Nodes

Extensions

Links