Icon

KNIME_​project_​Hamza

Nettoyage des données

EDA – Analyse exploratoire.

Transformation de la donnée

Lecture des données du Titanic
CSV Reader
Sélection des colonnes utiles pour l’analyse.
Column Filter
Recherche de doublons sur PassengerId.Aucun doublon trouvé, donc aucune ligne supprimée.
Duplicate Row Filter
Vérifie s’il existe des colonnes totalement vides.Aucune colonne 100 % manquante, tout est gardé.
Missing Value Column Filter
Traitement des valeurs manquantes- Age et Fare remplacé par la médiane.- Embarked remplacé par la modalité la plus fréquente.- Cabin remplacé par “Unknown”.
Missing Value
Statistiques descriptives du dataset
Statistics View
Histogramme de l’âge des passagers.
Histogram
Calcul des corrélations entre les variables numériques.
Linear Correlation
Histogramme du prix du billet (Fare).
Histogram
Création d’une colonne Child/Adult à partir de l’âge.
Rule Engine
Box plot pour visualiser les valeurs extrêmes de Fare.
Box Plot
Taille de la famille à bord.
Math Formula
Heatmap des corrélations pour visualiser les relations entre variables numériques.
Heatmap
Répartition des passagers par sexe
Bar Chart
CSV Writer
Création de classes d’âge (Enfant, Adolescent, Adulte, Senior…).
Rule Engine
Réorganisation des colonnes pour avoir d’abord les variables principales puis les variables dérivées.
Column Resorter

Nodes

Extensions

Links