Icon

Examen Hamza1

Data import

EDA

Nettoyage de la donnée

Table finale

Ce workflow KNIME permet de préparer le jeu de données « dirty_cafe_sales.csv » en vue de l’analyse.
Il comprend l’importation des données, une analyse exploratoire à l’aide de graphiques, puis une phase de nettoyage incluant la conversion des types, le traitement des valeurs manquantes et la suppression des doublons.
Une variable calculée correspondant au montant total par transaction est ensuite créée, avant la sélection des colonnes pertinentes afin d’obtenir une table finale propre et exploitable.

Importation de la basede donnée
CSV Reader
Ce graphique montre le chiffre d’affaires estimé par produit. On observe que certains produits concentrent une grande partie du CA, ce qui peut être lié à leur prix unitaire et/ou à une fréquence d’achat plus élevée.
Bar Chart
Aperçu statistique global pour vérifier les types de variables et les valeurs manquantes.
Statistics View
Ce graphique montre la répartition des transactions par produit.Les produits comme le café et les jus sont les plus vendus, tandis que la présence de valeurs UNKNOWN indique des problèmes de qualité des données.
Bar Chart
Ce graphique montre la répartition des méthodes de paiement utilisées par les clients.Il permet d’identifier les moyens de paiement dominants et de repérer la présence éventuelle de valeurs non renseignées.
Pie Chart
standardisation de valeur
String Replacer
Suppression des espaces inutiles dans les variables textuelles.
String Manipulation
Ce diagramme en barres présente le nombre de transactions selon le lieu de consommation.Il permet de comparer les ventes sur place et à emporter, et de détecter d’éventuelles valeurs incohérentes.
Bar Chart
Transformation de la date en format exploitable pour l’analyse temporelle.
String to Date&Time
Conversion des variables numériques depuis le format texte.
String to Number
Traitement des valeurs manquantes sur les variables importantes.
Missing Value
Harmonisation du format des variables textuelles.
String Manipulation
Standardisation des champs textuels pour éviter les incohérences.
String Manipulation
Conservation des colonnes nécessaires.
Column Filter
CSV final
CSV Writer
Suppression des lignes dupliquées dans le jeu de données.
Duplicate Row Filter
Calcule du montant théorique de chaque transaction (quantité × prix unitaire). afin d analyser le chiffre d’affaires.
Math Formula

Nodes

Extensions

Links