Icon

Clase_​20

WF1

  • Columna operada: Age — 177 NaN de 891 filas

  • Remove Row: de 891 filas quedan 714 — pérdida del 20% de datos

  • Fixed Value = 0: distorsiona la media de Age — baja artificialmente

  • Median: imputa con 28 — mantiene la distribución central estable

  • La imputación debe hacerse antes del escalado porque el Normalizer calcula min y max sobre los datos — si hay NaN el cálculo falla o queda sesgado

WF2

  • Age con Mean: imputa con 29.7 — sensible a outliers

  • Age con Median: imputa con 28 — más robusta con outliers

  • Comparar Statistics — la media resultante es diferente en cada caso

  • Most Frequent no aplica sobre columnas numéricas

  • En producción calcular la estrategia solo con datos de train evita data leakage

WF3

  • Min-Max: valores entre 0 y 1 — sensible a outliers — usar con Redes Neuronales y KNN

  • Z-Score: media 0 y desviación 1 — más robusto con outliers — usar con Regresión y SVM

  • Random Forest: no requiere escalado — basado en árboles de decisión

  • KNN: muy sensible al escalado — siempre escalar antes

  • Redes Neuronales: Min-Max recomendado — convergencia más rápida

CSV Reader
Statistics
Statistics
Statistics
Statistics
Statistics
Missing Value
Missing Value
Statistics
Missing Value
Missing Value
CSV Reader
Statistics
Missing Value
Statistics
Normalizer
Normalizer
CSV Reader
CSV Reader

Nodes

Extensions

Links