Icon

Entrenamiento Predicción mora Facturas

<p>Este flujo tiene como objetivo construir, entrenar y seleccionar el mejor modelo de clasificación para predecir la probabilidad de que una factura entre en mora, utilizando datos históricos de facturación.</p><p>El proceso se estructura en cinco etapas principales:</p><p>1️⃣ Lectura de datos</p><p>Se cargan los datos históricos de facturas desde un archivo CSV.<br>Estos datos constituyen la base para entrenar el modelo predictivo y contienen información de fechas, montos, comportamiento de pago y variables del cliente.</p><p>2️⃣ Preprocesamiento y generación de variables</p><p>En esta etapa se realiza la preparación de los datos:</p><ul><li><p>Ajuste y normalización de fechas.</p></li><li><p>Cálculo de la variable objetivo <strong>“Mora”</strong>, que indica si la factura fue pagada fuera del plazo establecido.</p></li><li><p>Creación de variables derivadas que capturan el comportamiento histórico del cliente, tales como:</p><ul><li><p>Promedio de días de pago.</p></li><li><p>Porcentaje histórico de facturas en mora.</p></li><li><p>Indicador de factura anterior en mora.</p></li></ul></li></ul><p>Estas variables permiten incorporar información de riesgo basada en comportamiento pasado.</p><p>3️⃣ Entrenamiento de modelos</p><p>La base de datos se divide en:</p><ul><li><p>70% para entrenamiento</p></li><li><p>30% para pruebas</p></li></ul><p>Se entrenan tres modelos de clasificación supervisada:</p><ul><li><p>Regresión Logística</p></li><li><p>Random Forest</p></li><li><p>Gradient Boosted Trees</p></li></ul><p>Cada modelo aprende patrones asociados al incumplimiento de pago.</p><p>4️⃣ Predicción de mora</p><p>Los modelos entrenados se aplican sobre el conjunto de prueba para:</p><ul><li><p>Predecir si la factura entrará en mora.</p></li><li><p>Calcular la probabilidad estimada de mora.</p></li></ul><p>Esto permite evaluar no solo la clasificación binaria, sino también el nivel de riesgo asociado.</p><p>5️⃣ Evaluación y selección del mejor modelo</p><p>Se consolidan las predicciones y probabilidades generadas por cada modelo para:</p><ul><li><p>Comparar métricas de desempeño (accuracy, matriz de confusión, etc.).</p></li><li><p>Analizar resultados comparativos.</p></li><li><p>Seleccionar automáticamente el modelo con mayor capacidad predictiva.</p></li></ul><p>El modelo con mejor desempeño se guarda para su uso en predicciones futuras.</p><p>🎯 Resultado Final</p><p>El flujo permite:</p><ul><li><p>Identificar clientes o facturas con mayor riesgo de mora.</p></li><li><p>Cuantificar probabilidades de incumplimiento.</p></li><li><p>Seleccionar el modelo más robusto de forma automatizada.</p></li><li><p>Dejar preparado un modelo listo para implementación en escenarios reales.</p></li></ul>
Lectura

  1. Datos históricos para entrenar el modelo predictivo

Preprocesamiento datos

  1. Ajuste de fechas

  2. Calcula si la factura está en mora

  3. Variables derivadas

    • Promedio de días al pago

    • %Moras anteriores

    • Factura anterior en mora

Predicción de mora en facturas

  1. Predice si la factura va a entrar en mora

  2. Calcula la probabilidad de entrar en mora

Entrenamiento modelo

  1. Partición de base entrenamiento 70% y 30% Pruebas

  2. Modelos entrenados

    1. Regresión Logística

    2. Random Forest

    3. Gradient Boosted

Evaluación y comparación de modelos

  1. Unifica predicciones y probabilidades

  2. Muestra métricas comparativas entre los moldeos

Escribe el mejor modelo para ser usado en predicciones futuras

  1. Concatena métricas de calidad de todos los modelo

  2. Selecciona el modelo con más accuracy

  3. Guarda modelo con mejor accuracy

Gradient Boosted Trees Predictor
Logistic Regression Predictor
Seleeción modelo productivo
Logistic Regression Learner
MoraVariable a predecir1-Factura en mora0-Factura No Mora
Expression
Joiner
Joiner
Random Forest Learner
Binary Classification Inspector
70% entrenamiento modelo30% pruebas modelo
Table Partitioner
Facturas
CSV Reader
Ajuste de fechas
Random Forest Predictor
Cálculo variables derivadas
Gradient Boosted Trees Learner

Nodes

Extensions

Links