Icon

KNIME_​project

Import du fichier brut dirty_cafe_sales.csv
CSV Reader
Suppression des doublons sur Transaction ID
Duplicate Row Filter
Nettoyage de la colonne Item : suppression des espaces inutiles pour homogénéiser les valeurs produits.
String Manipulation
Nettoyage de la colonne Payment Method : trim des espaces et harmonisation de l’écriture des modes de paiement.
String Manipulation
Nettoyage de la colonne Location : suppression des espaces parasites afin d’uniformiser les libellés de lieu (in-store, takeaway, etc.).
String Manipulation
Conversion de Quantity, Price Per Unit et Total Spent en variables numériques.
String to Number
Conversion de Transaction Date en type date (yyyy-MM-dd) pour analyses temporelles.
String to Date&Time
Création d’une colonne Total_Check = Quantity × Price Per Unit pour contrôler la cohérence du montant total.
Math Formula
Imputation des valeurs manquantes pour Quantity, Price Per Unit et Total Spent par la moyenne afin de conserver toutes les transactions pour l’analyse.
Missing Value
Export de la table propre clean_cafe_sales.csv à partir du jeu de données Dirty Cafe Sales.
CSV Writer
Traitement des valeurs manquantes pour Item, Payment Method et Location par la valeur ‘Unknown’ pour expliciter les cas indéterminés.
Missing Value
Ce graphique montre le chiffre d’affaires total généré par chaque type de produit
Bar Chart
Sélection des colonnes finales nettoyées et de la variable dérivée Total_Check pour analyse et export
Column Filter
Statistics View
GroupBy
distribution des montants dépensés par transaction
Histogram

Nodes

Extensions

Links