Icon

Proyecto final 2

Fase 1: EDA (Exploratory Data Analysis)

Objetivo: Analizar estructura y calidad del dataset.

    1. El dataset no presenta valores extremos que afecten el análisis.

    2. Distribución de variables como Income y Balance muestra sesgo positivo (clientes con ingresos altos son minoría).

Fase 2: Preprocesamiento

Objetivo: Limpiar y preparar datos.

    • Variables numéricas normalizadas para evitar sesgo en el modelo.

    • Conversión de variables categóricas lista para clasificación/regresión.

Fase 3: Modelado

    • Árbol identifica Income, CCAvg y Education como variables más importantes.

    • Clientes con ingresos altos y buen historial son más propensos a aceptar préstamo.

Fase 4: Evaluación

  • ROC Curve: AUC ≈ 0.963 → excelente desempeño.

  • Scorer: Accuracy ≈ 90.7%, Precision ≈ 91.4%, Recall ≈ 90.1%.

Hipótesis: El ingreso y el comportamiento financiero son factores clave en la aceptación de préstamos personales.

Comprobación: “El modelo confirma que Income es el predictor más importante, seguido por CCAvg y Education. Accuracy > 90% y AUC > 0.96.

BASE PARA VENTAS:

Importación del Dataset
CSV Reader
Resumen Estadístico del Dataset
Statistics
Row Filter
Análisis de Distribución y Outliers
Box Plot
Visualización de Distribuciones
Bar Chart
Análisis de Valores Faltantes y Calidad de Datos
Missing Value
Normalización de Variables Numéricas
Normalizer
“División del dataset para entrenamiento y prueba
Table Partitioner
Decision Tree Predictor
Entrenamiento del modelo predictivo
Decision Tree Learner
Agrupación por Variables Categóricas
GroupBy
Conversión de variables numéricas a categóricas
Number to String
ROC Curve
Scorer
Bar Chart
Row Filter
Decision Tree Predictor
Análisis de Distribución y Outliers
Box Plot

Nodes

Extensions

Links