Entrenamiento Predicción mora Facturas

Este flujo tiene como objetivo construir, entrenar y seleccionar el mejor modelo de clasificación para predecir la probabilidad de que una factura entre en mora, utilizando datos históricos de facturación.El proceso se estructura en cinco etapas principales:1️⃣ Lectura de datosSe cargan los datos históricos de facturas desde un archivo CSV. Estos datos constituyen la base para entrenar el modelo predictivo y contienen información de fechas, montos, comportamiento de pago y variables del cliente.2️⃣ Preprocesamiento y generación de variablesEn esta etapa se realiza la preparación de los datos:<ul><li>Ajuste y normalización de fechas.</li><li>Cálculo de la variable objetivo “Mora”, que indica si la factura fue pagada fuera del plazo establecido.</li><li>Creación de variables derivadas que capturan el comportamiento histórico del cliente, tales como:<ul><li>Promedio de días de pago.</li><li>Porcentaje histórico de facturas en mora.</li><li>Indicador de factura anterior en mora.</li></ul></li></ul>Estas variables permiten incorporar información de riesgo basada en comportamiento pasado.3️⃣ Entrenamiento de modelosLa base de datos se divide en:<ul><li>70% para entrenamiento</li><li>30% para pruebas</li></ul>Se entrenan tres modelos de clasificación supervisada:<ul><li>Regresión Logística</li><li>Random Forest</li><li>Gradient Boosted Trees</li></ul>Cada modelo aprende patrones asociados al incumplimiento de pago.4️⃣ Predicción de moraLos modelos entrenados se aplican sobre el conjunto de prueba para:<ul><li>Predecir si la factura entrará en mora.</li><li>Calcular la probabilidad estimada de mora.</li></ul>Esto permite evaluar no solo la clasificación binaria, sino también el nivel de riesgo asociado.5️⃣ Evaluación y selección del mejor modeloSe consolidan las predicciones y probabilidades generadas por cada modelo para:<ul><li>Comparar métricas de desempeño (accuracy, matriz de confusión, etc.).</li><li>Analizar resultados comparativos.</li><li>Seleccionar automáticamente el modelo con mayor capacidad predictiva.</li></ul>El modelo con mejor desempeño se guarda para su uso en predicciones futuras.🎯 Resultado FinalEl flujo permite:<ul><li>Identificar clientes o facturas con mayor riesgo de mora.</li><li>Cuantificar probabilidades de incumplimiento.</li><li>Seleccionar el modelo más robusto de forma automatizada.</li><li>Dejar preparado un modelo listo para implementación en escenarios reales.</li></ul>

Nodes

Extensions

No modules found

Lectura

Preprocesamiento datos

Predicción de mora en facturas

Entrenamiento modelo

Evaluación y comparación de modelos

Escribe el mejor modelo para ser usado en predicciones futuras