Icon

Clase_​07

WF1

  • Age — Lower bound: -7 (sin outliers inferiores, límite negativo sin sentido en edad), Upper bound: 65, Outlier count: 8 pasajeros mayores de 65 años

  • Fare — Lower bound: -26.761 (sin outliers inferiores, tarifa mínima es 0), Upper bound: 65.656, Outlier count: 116 pasajeros con tarifa superior a 65.656 — mayoría de primera clase

  • El Box Plot confirma visualmente estos límites como los bigotes de cada variable

  • Fare tiene 116 outliers — distribución extremadamente sesgada a la derecha, el método IQR es adecuado porque no asume normalidad

WF2

  • Duplicate Row Filter — 0 duplicados eliminados, 891 filas continúan

  • String Manipulation — columnas Name_clean y Sex_clean creadas en minúsculas y sin espacios

  • Numeric Outliers — Age: 8 outliers, Fare: 116 outliers detectados por IQR

  • Row Filter — de 891 filas entraron, 606 salieron — 285 filas eliminadas por estar fuera del rango IQR

  • Rule Engine — todas las 606 filas restantes marcadas como ok — esperado porque el Row Filter ya eliminó los valores fuera de rango antes de llegar al Rule Engine

WF3

  • Duplicate Row Filter — 0 duplicados eliminados, 891 filas continúan

  • String Manipulation — columnas Name_clean, Sex_clean y Embarked_clean verificadas en Table View: texto en minúsculas y sin espacios extra

  • Numeric Outliers — Q1 y Q3 extraídos desde 2: Summary: Age Lower -7, Upper 65 — Fare Lower -26.761, Upper 65.656

  • Pipeline completo: datos salen limpios de duplicados, texto normalizado y outliers identificados — listos para análisis

CSV Reader
Table View
Box Plot
Numeric Outliers
CSV Reader
String Manipulation
Numeric Outliers
Duplicate Row Filter
String Manipulation
String Manipulation
Row Filter
Rule Engine
Numeric Outliers
String Manipulation
CSV Reader
Duplicate Row Filter

Nodes

Extensions

Links