Icon

Clase_​08

WF1

  • Age — 177 valores faltantes — Mean ≈ 29.69 vs Median ≈ 28 — estrategia elegida: Median — justificación: distribución sesgada y outliers en edades altas distorsionan la media

  • Fare — 0 valores faltantes — si los hubiera, Median sería preferible por outliers extremos (máx 512)

WF2

  • Age — 19.87% faltantes — MAR — imputar con Median

  • Embarked — 0.22% faltantes — MCAR — imputar con Most Frequent

  • Cabin — 77.1% faltantes — MNAR — estrategia: Remove Row — filas con Cabin vacía eliminadas — de 891 filas quedaron 204

WF3

  • Duplicate Row Filter ejecutado sobre todas las columnas — 891 filas únicas conservadas — 0 duplicados eliminados

  • El Titanic no tiene filas exactamente duplicadas — dataset limpio en términos de duplicados

  • Verificar duplicados eliminados: clic derecho sobre Duplicate Row Filter → View: Duplicate rows

CSV Reader
Missing Value
Missing Value
Table View
CSV Reader
Duplicate Row Filter
Statistics
Missing Value
Table View
CSV Reader
Table View
Table View

Nodes

Extensions

Links