Icon

tp1 knime karim mnassri

This workflow accesses customer and transactions data, transforms the data and generates an interactive view with multiple visualizations.

This workflow accesses customer and transactions data, transforms the data and generates an interactive view with multiple visualizations.

TP 1 : Analyse des transactions clients

Étape 1.1. Accéder aux données à partir d'un ou plusieurs fichiers

  1. Lire le fichier CustomerInfoSystem1.xlsx avec le nœud Excel Reader

  2. Lire le fichier CustomerInfoSystem2.table avec le nœud Table Reader

  3. Lire le fichier Stores.csv avec le nœud CSV Reader


Étape 1.2. Accéder aux données depuis une base de données

  1. Connectez-vous à la base de données avec le nœud SQLite Connector

  2. Avec deux nœuds DB Table Selector, sélectionnez les tables.

    Transactions

    ProductNrAndPrice

  3. Lisez les tables avec deux nœuds DB Reader.


Étape 2.1. Nettoyer les données

Nettoyer les données du 'Customer Information System 1'

  1. Exclure la première ligne et la première colonne avec le nœud «Table Cropper »

  2. Supprimer les lignes contenant des identifiants client en double avec le nœud « Duplicate Row Filter »

  3. Si l'âge est manquant, insérer l'âge moyen de l'ensemble de données avec le nœud « Missing Value »


Étape 5.1. Agréger les données I

  1. Additionnez le Price de chaque CustomerID avec le nœud Row Aggregator


Étape 6.1. Exporter les données

  1. Écrivez le tableau contenant le prix total par client avec le nœud Excel Writer


Étape 6.2. Visualiser les données I

  1. Convertir la taille du panier (BasketSize) avec le nœud Number to String

  2. Afficher dans un graphique à barres (BarChart ) le nombre de commandes pour chaque taille de panier, pour les boutiques en ligne et sur site


Étape 6.4. Composants et rapports

  1. Create a component containing the visualization nodes

  2. Use the Layout Editor to rearrange the interactive view of the component

  3. Select Enable Reporting in the Layout Editor

  4. Add a Report Template Creator node before the component and export its view as a PDF report with the Report PDF Writer node

  5. Créer un composant contenant les nœuds de visualisation

  6. Utiliser Layout Editor pour réorganiser la vue interactive du composant.

  7. Sélectionner « Enable Reporting » dans Layout Editor.

  8. Ajouter un nœud «Report Template Creator » avant le composant et exporter sa vue au format PDF avec le nœud « Report PDF Writer».


Étape 5.2. Agrégation des données II

  1. Calculez le Basket Size de chaque commande (nombre de produits de chaque commande) avec le nœud GroupBy. Ce calcul peut être obtenu en comptant n'importe quelle colonne. Conservez les informations sur StoreType.

  2. Affichez le nombre de commandes pour chaque panier (Basket Size), respectivement dans la boutique en ligne (Online Store) et sur site (Onsite Store), avec le nœud Pivot.


Étape 5.3. Agrégation des données III

  1. Dans une nouvelle branche, répétez l'étape 5.1 avec un nœud GroupBy. Cette fois, pour chaque client, conservez :

    1. CustomerID

    2. CustomerGroup

    3. AgeGroup

    4. Sum of Price

    5. Mean Price

    6. Unique Count of ProductNr


Étape 6.3. Visualiser les données II

  1. Attribuez une couleur à chaque ligne en fonction de la colonne « CustomerGroup  » avec le nœud Color Manager.

  2. Dans un nuage de points (Scatter Plot), affichez la somme de prix (Sum(Price)) et le nombre unique (Unique Count(ProductNr)).

  3. Affichez le nombre d'occurrences pour CustomerGroup dans un graphique à barres ( Bar Chart).

  4. Affichez un graphique Parallel Coordinates Plot avec :

    AgeGroup

    CustomerGroup

    Sum(Price)

    Unique Count(ProductNr)

  5. Créez un titre avec le nœud « Affichage texte ».


Remarque : appliquez la couleur lorsque cela est possible. Dans le graphique à barres (Bar Chart), dans l'option « Group Bar  », sélectionnez « Frequency Dimension ».


Objectifs : Accéder, nettoyer, transformer, fusionner et agréger des données pour rapporter et visualiser les résultats.


Description du flux de travail : ce flux de travail accède aux données des clients et des transactions, transforme les données et génère une vue interactive avec plusieurs visualisations.


Vous trouverez les informations sur les cas d’utilisation dans les annotations bleues et les instructions pour les exercices dans les annotations jaunes.

Use Case

Asma, du service commercial, souhaite créer un rapport et visualiser les données de transaction client collectées chaque mois par son équipe. Ces données incluent le prix total par client et le montant du panier par type de magasin. Asma reçoit chaque mois des données provenant de sources multiples, qui doivent être fusionnées, épurées et transformées avant d'être intégrées dans un rapport. Elle vous a donc contacté pour l'aider à automatiser le processus et ainsi gagner du temps.


Votre projet consistera à aider Asma à créer un flux de travail pour rapporter les informations mensuelles, en complétant chaque étape du processus qu'elle répète chaque mois ci-dessous.

1. Accès aux données

Asma reçoit les données de plusieurs sources, notamment des fichiers et des tables de bases de données. Votre première tâche consiste à créer le flux de travail en accédant aux différentes sources de données.

2. Nettoyage des données

Maintenant que l'accès aux données est établi, Asma sollicite votre aide pour nettoyer les données, car il semble y avoir des doublons, des valeurs manquantes et des colonnes inutiles.

3. Transformation des données

Ensuite, vous devez fusionner les données nettoyées. Pour ce faire, Asma explique comment elle transforme généralement certaines données des lignes et remodèle certaines colonnes pour obtenir la forme souhaitée.

6. Exportation, visualisation et création de rapports de données

Asma est ravie que les données soient prêtes à être exportées. Son équipe a besoin des résultats de la phase 5.1 sous forme de fichier Excel, de la phase 5.2 sous forme de graphique à barres et de la phase 5.3 sous forme de tableau de bord interactif exportable au format PDF.

4. Fusion de données

Avec les données nettoyées et sous la forme correcte, vous pouvez maintenant aider Asma à fusionner les différentes sources de données, en empilant des tables et en faisant correspondre ou en joignant d'autres pour ajouter les colonnes nécessaires.

5. Agrégation de données

Vous avez maintenant atteint le point où les données de Asma peuvent être agrégées pour obtenir les informations nécessaires concernant les prix et les tailles de panier des clients et des magasins.

Étape 4.1. Fusionner les données

  1. Concaténez les deux tables customer avec le nœud Concatenate.

  2. Ajoutez le StoreType (dans le fichier Stores.csv) et le Price (de la table de base de données ProductNrAndPrice) à chaque transaction (stockée dans la table de base de données Transactions) avec deux nœuds Value Lookup.

  3. Joignez les tables Customer et Transaction sur la colonne CustomerID avec le nœud Joiner.


Remarque : Le premier port de sortie du jointeur affiche les lignes correspondantes dans les deux tables. Utilisez uniquement ces lignes dans les étapes suivantes.


Étape 3.1. Transformer les données

  1. Créez une nouvelle colonne AgeGroup avec les valeurs Adolescent, Adult, Older Adult selon la valeur age : <18 Adolescents, 18-65 Adults, >65 Older Adults

  2. Remplacez le caractère "_" par un espace " " de la colonne country Country

  3. Divisez la colonne CustomerID sur le caractère « _ » avec le nœud Cell Splitter

  4. Renommer les colonnes créées par la division avec le nœud Column Renamer

  5. Fusionnez les colonnes E-mail  et  CorporateEmail avec le nœud  Column Merger. Conservez l'Email lorsque les deux sont disponibles.

  6. Convertir la colonne Newsletter avec le nœud Number to String


Exécutez les instructions 1 et 2 avec deux nœuds Expression. Cliquez sur « K-AI » et copiez-collez le texte de l'instruction dans l'invite.

Étape 3.2. Nettoyer le flux de travail avec un métanode

  1. Upload the workflow to your private space of KNIME Community Hub and create a version of the workflow*

  2. Répétez les étapes de nettoyage et de transformation des données pour les données du Customer Information System 2.

  3. Nettoyez le flux de travail dans un Metanode.

  4. Chargez le flux de travail dans votre espace privé du Hub communautaire KNIME et créez-en une version*.


*Si vous n'en avez pas déjà un, créez un compte gratuit sur hub.knime.com

Excel Reader
Table Reader
Concatenate
CSV Reader
SQLite Connector
DB Table Selector (deprecated)
DB Table Selector (deprecated)
DB Reader
Rule Engine
String Replacer
GroupBy
GroupBy
Value Lookup
Value Lookup
Excel Writer
Number to String
Pivot
Color Manager
Duplicate Row Filter
GroupBy
Bar Chart
DB Reader
Column Renamer
Column Merger
Missing Value
Joiner
Cell Splitter
Number to String
Table Cropper

Nodes

Extensions

Links