Icon

Cómo detectar y tratar los valores atípicos

<p><strong>How to detect and deal with Outliers</strong></p><p>Starts with the <strong>Iris dataset</strong>, then applies two main strategies for handling outliers: <strong>IQR-based outlier detection</strong> (to either replace or remove outliers) and <strong>Z-score normalization</strong> (to standardize numeric columns). After normalization, it identifies rows where the absolute z-score is greater than 2, marking them as outliers, and finally <strong>filters out these outlier rows</strong> to keep only the typical data points for further analysis.</p>

Estrategia de sustitución de valores atípicos:

Sustituir los valores atípicos por valores nulos

Estrategia de sustitución de valores atípicos: eliminar las filas con valores atípicos

Estrategia de sustitución de valores atípicos: eliminar las filas que no sean valores atípicos

Cómo detectar y tratar los valores atípicos

Comienza con el conjunto de datos «Iris» y, a continuación, aplica dos estrategias principales para tratar los valores atípicos: la detección de valores atípicos basada en el intervalo intercuartílico (para sustituir o eliminar dichos valores) y la normalización mediante la puntuación Z (para estandarizar las columnas numéricas). Tras la normalización, identifica las filas en las que la puntuación Z absoluta es superior a 2, las marca como valores atípicos y, por último, filtra estas filas para conservar únicamente los puntos de datos típicos con vistas a su posterior análisis.

Iris Dataset
Example Data Reader
Numeric Outliers
Numeric Outliers
Numeric Outliers
Normalización mediante la puntuación Z
Normalizer
|z| > 2
Expression
filtrar los valores atípicos
Row Filter
Detección de valores atípicos basada en el intervalo intercuartílico
Numeric Outliers

Nodes

Extensions

Links