Icon

Analyse Kundentransaktionen_​Template

This workflow accesses customer and transactions data, transforms the data and generates an interactive view with multiple visualizations.

This workflow accesses customer and transactions data, transforms the data and generates an interactive view with multiple visualizations.

KNIME Einführung

Use Case: Analyse von Kundentransaktionen

Schritt 1.1: Zugriff auf Daten aus Datei(en)

  1. CustomerInfo (customer1.xlsx) mit dem Excel Reader einlesen

  2. CustomerInfo (customer2.table) mit dem Table Reader einlesen

  3. Stores.csv mit dem CSV Reader einlesen


Schritt 1.2: Zugriff auf Daten aus einer Datenbank

  1. Mit dem SQLite Connector zur Datenbank verbinden

  2. Im DB Table Selector die Tabellen auswählen:

    • Transactions

    • ProductInfo

  3. Die Tabellen mit zwei DB Reader-Nodes einlesen


Schritt 2.1: Daten bereinigen

Customer Information System 1 – Daten bereinigen

  1. Erste Zeile und erste Spalte mit dem Table Cropper entfernen

  2. Zeilen mit doppelter CustomerID mit dem Duplicate Row Filter entfernen

  3. Wenn Age fehlt: das Durchschnittsalter (Mean) des Datensatzes einsetzen – mit Missing Value


Schritt 3.2: Workflow aufräumen mit einer Metanode

  1. Die Schritte Datenbereinigung und Datentransformation auch für die Daten aus Customer Information System 2 durchführen

  2. Den Workflow in einer Metanode sauber zusammenfassen/strukturieren

Schritt 5.1: Datenaggregation I

  1. Den Price pro CustomerID aufsummieren mit dem Row Aggregator


Schritt 6.1: Daten exportieren

  1. Tabelle mit dem Total Price pro Customer mit dem Excel Writer schreiben/exportieren


Schritt 6.2: Daten visualisieren I

  1. BasketSize mit Number to String konvertieren

  2. In einem Bar Chart die Anzahl Bestellungen je BasketSize anzeigen – getrennt für Online und Onsite Stores


Schritt 6.4: Komponenten und Reporting

  1. Eine Komponente erstellen, die die Visualisierungs-Nodes enthält

  2. Im Layout Editor die interaktive Ansicht der Komponente anordnen

  3. Im Layout Editor Enable Reporting aktivieren

  4. Unter der Komponente einen Report Template Creator hinzufügen und als PDF exportieren – mit Report PDF Writer


Schritt 5.2: Datenaggregation II

  1. Basket Size je Bestellung berechnen (Anzahl Produkte in der Bestellung) mit GroupBy
    (durch Zählen einer Spalte; die Information kann für den StoreType gruppiert werden)

  2. Anzahl Bestellungen je Basket Size für Online Store und Onsite Store darstellen (über Pivot)


Schritt 5.3: Datenaggregation III

  1. In einem neuen Branch Schritt 5.1 mit GroupBy wiederholen. Diesmal pro Kunde ausgeben:

    1. CustomerID

    2. CustomerGroup

    3. AgeGroup

    4. Sum Price (Summe Preis)

    5. Mean Price (Durchschnittspreis)

    6. Unique Count of ProductsNr (eindeutige Anzahl Produkte)


Schritt 6.3: Daten visualisieren II

  1. Jedem Datensatz eine Farbe gemäß CustomerGroup zuweisen (mit Color Manager)

  2. In einem Scatter PlotSum(Price) und Unique Count(ProductsNr) visualisieren

  3. Anzahl Kunden je CustomerGroup in einem Bar Chart darstellen

  4. Parallel Coordinates Plot erstellen mit:

    • AgeGroup

    • CustomerGroup

    • Sum(Price)

    • Unique Count(ProductsNr)

  5. Eine Tabelle mit Text View erzeugen


Hinweis im Template: Die Farben nach Möglichkeit auch in den Charts anwenden (z. B. über die Gruppen-/Frequenzdimension).


Lernziele: Daten abrufen, bereinigen, transformieren, zusammenführen und aggregieren, um Ergebnisse zu berichten und zu visualisieren.


Workflow-Beschreibung: Dieser Workflow greift auf Kunden- und Transaktionsdaten zu, transformiert die Daten und erzeugt ein interaktives Ergebnis (mit mehreren Visualisierungen).


Hinweis: Die Use-Case-Informationen stehen in den blauen Boxen, die Anleitungen zu den Übungen in den gelben Boxen.

Use Case

Pauline aus dem Sales-Team möchte jeden Monat einen Report erstellen und visualisieren, der die Kundentransaktionsdaten über mehrere Kanäle auswertet. Dazu soll u. a. der Gesamtpreis pro Kunde berechnet und analysiert werden. Die Daten kommen monatlich aus mehreren Quellen und müssen daher bereinigt, vereinheitlicht und zusammengeführt werden, bevor man sie sinnvoll reporten kann. Pauline hat um Unterstützung gebeten, um diesen Prozess in KNIME sauber abzubilden.
Ziel ist es, Pauline zu helfen, indem man Schritt für Schritt einen Workflow baut, der die monatlichen Insights reproduzierbar erstellt.

Datenzugriff

Pauline erhält die Daten aus mehreren Quellen (Dateien und Datenbank). Man unterstützt sie dabei, den Workflow aufzubauen, indem man die verschiedenen Datenquellen korrekt einliest.

Datenbereinigung

Sobald der Datenzugriff steht, unterstützt man Pauline beim Bereinigen der Daten, da einige Werte Duplikate enthalten bzw. fehlen und manche Spalten nicht benötigt werden.

Datentransformation

Nach der Bereinigung müssen die Daten in eine Form gebracht werden, wie Pauline sie üblicherweise benötigt bzw. wie sie später zusammengeführt und ausgewertet werden können.

Datenexport, Visualisierung und Reporting

Pauline ist zufrieden, wenn die Daten exportiert werden, ihre Teamkolleg*innen die Ergebnisse in Schritten 5.1–5.3 sehen können und daraus Diagramme bzw. ein Report erzeugt werden kann.

Datenzusammenführung

Sind die Daten bereinigt und transformiert, kann man Pauline beim Zusammenführen der verschiedenen Datensätze unterstützen, indem die Tabellen korrekt kombiniert und angereichert werden.

Datenaggregation

Man hat nun den Punkt erreicht, an dem Paulines Daten aggregiert werden können, um wichtige Erkenntnisse zu Preis und Bestellungen pro Kunde/Gruppe zu erhalten.

Schritt 4.1: Daten zusammenführen

  1. Die beiden Customer-Tabellen mit Concatenate zusammenführen

  2. StoreType (aus Store.csv) und Price (aus ProductInfo) mit zwei Value Lookup-Nodes anreichern

  3. Customer- und Transaction-Tabellen über die Spalte CustomerID mit Joiner verbinden


Hinweis im Template: Der „erste Output-Port“ des Joiner zeigt Zeilen ohne Match in den beiden Tabellen. Nur diese Zeilen in den nächsten Schritten verwenden.


Schritt 3.1: Daten transformieren

  1. Neue Spalte AgeGroup erstellen mit den Werten Adolescent, Adult, Older Adult – abhängig vom Alter (z. B. <18, 18–65, >65)

  2. In der Spalte Country das Zeichen "_" durch ein Leerzeichen " " ersetzen

  3. Die Spalte CustomerID am Zeichen "_" mit dem Cell Splitter-Node aufteilen

  4. Die durch das Splitten entstandenen Spalten mit dem Column Renamer-Node umbenennen

  5. Die Spalten Email und CorporateEmail mit dem Column Merger-Node zusammenführen. Email behalten, wenn beide vorhanden sind.

  6. Die Spalte Newsletter mit Number to String in einen Text-Datentyp konvertieren


Hinweis im Template: Die Anweisungen 1 und 2 mit Expression-Nodes umsetzen.

Excel Reader
Table Reader
CSV Reader
SQLite Connector
DB Table Selector
DB Table Selector
DB Reader
Duplicate Row Filter
DB Reader
String Replacer
Table Cropper
Cell Splitter
Missing Value
Expression
Number to String
Value Lookup
Joiner
Column Renamer
Metanode
Column Merger
Concatenate

Nodes

Extensions

Links