Icon

KNIME_​projec

Suppression des doublons2 lignes dupliquées détectées et supprimées (Patient P1069 et P1089)Résultat : 113 lignes restantes
CSV Reader
Suppression des doublons2 lignes dupliquées détectées et supprimées (Patient P1069 et P1089)Résultat : 113 lignes restantes
Duplicate Row Filter
Normalisation de la colonne Sexe8 variantes incohérentes détectées : M, F, MASCULIN, FÉMININ, masculin, feminin…Uniformisées en 2 valeurs standards : Masculin / Féminin
Rule Engine
Uniformisation des formats de date — colonne Date_VisiteProblème : mélange de formats DD/MM/YYYY et YYYY-MM-DDCorrection : toutes les dates converties au format ISO 8601 (YYYY-MM-DD)Formule : regexReplace()
String Manipulation
Traitement des valeurs manquantes58 valeurs manquantes réparties sur 6 colonnes :Age(12), Poids(11), Température(12), Glycémie(10), Coût(6), Groupe_Sanguin(7)Stratégie : Moyenne (Mean) pour les colonnes numériques (Age, Poids, Température, Glycémi
Missing Value
Export du dataset nettoyé — healthcare_dataset_clean.csv113 lignes · 18 colonnes · 0 valeur manquanteDataset prêt pour l'analyse et la modélisation
CSV Writer
Analyse de la structure : types de variables, min, max, moyenne, valeurs manquantes
Statistics
Distribution de l'Age des patients - EDA
Histogram
Détection des valeurs aberrantes : Age, Poids, Température, Glycémie
Box Plot

Nodes

Extensions

Links