Icon

Examen

Data import

EDA

Feature Engineering

Data cleaning and formatting

Final table

Save Final Table

Read CSV file from my local computer
CSV Reader
Une exploration initiale du jeu de données a été réalisée en examinant les types de données, les valeurs manquantes et le nombre de valeurs distinctes afin d’identifier les variables clés et de détecter précocement les anomalies.
Statistics View
=> Ce diagramme en barres montre le nombre de transactions par produit. Les produits comme Coffee et Juice sont les plus vendus, tandis que les catégories UNKNOWN et ERROR indiquent des problèmes de qualité des données.
Bar Chart
Ce graphique circulaire représente la répartition des méthodes de paiement utilisées par les clients. Le paiement par carte et en espèces est majoritaire, tandis que la catégorie UNKNOWN indique des valeurs manquantes ou mal renseignées.
Pie Chart
Nettoyage des variables textuelles (Item, Payment Method, Location) par suppression des espaces superflus et uniformisation des formats.
String Manipulation
Ce diagramme en barres présente la répartition des transactions selon le lieu de consommation. La majorité des ventes sont réalisées en magasin ou à emporter, ce qui reflète les habitudes des clients. La présence de la valeur UNKNOWN met en évidence
Bar Chart
Conversion de la variable Transaction Date du format texte vers un format date exploitable pour l’analyse temporelle.
String to Date&Time
String to number : column : Qunaityt , Price per Unit, Total pent
String to Number
Suppression des lignes contenant des valeurs manquantes sur les variables essentielles afin de garantir la qualité des données.
Missing Value
Nettoyage des variables textuelles (Item, Payment Method, Location) par suppression des espaces superflus et uniformisation des formats.
String Manipulation
Nettoyage des variables textuelles (Item, Payment Method, Location) par suppression des espaces superflus et uniformisation des formats.
String Manipulation
Conserve uniquement les colonnes : Transaction ID, Item, Quantity, Price Per Unit, Computed Total, Payment Method, Location, Transaction Date.
Column Filter
Save final table
CSV Writer
Détection et suppression des lignes dupliquées afin d’éviter les redondances dans la table finale.
Duplicate Row Filter
Création d’une variable calculée Computed Total correspondant au montant total par transaction (Quantity × Price Per Unit).
Math Formula

Nodes

Extensions

Links