Icon

opgave 3 mandatory

Excel Reader
fjerner rækker hvor Quantity er 0 eller negativ, fordi det ofte er returvarer eller fejl.
Row Filter
fjerner rækker hvor UnitPrice er 0 eller negativ, så "Monetary" ikke bliver forkert. (RFM)
Row Filter
laver en ny kolonne, der viser hvor meget hver linje er værd i kroner/valuta
Math Formula
samler alle køb for hver kunde til tre tal: sidste købsdato, antal køb, og samlet forbrug (RFM) mangler stadig R specificering
GroupBy
Fjern instanser, hvor customerID mangler.
Missing Value
Beregner RecencyDays som antal dage mellem kundens sidste købsdato (Max InvoiceDate) og SnapshotDate. Dette er ‘Recency’ i RFM.
Date&Time Difference
Tilføjer en fast reference-dato (SnapshotDate), som vi bruger til at beregne hvor mange dage siden kundens seneste køb.
Expression
Deler kunderne op i k segmenter baseret på deres RFM-mønster (unsupervised clustering). Hver kunde får tildelt et cluster-id, som vi bruger til at beskrive og sammenligne segmenterne.
k-Means
Konverterer SnapshotDate fra tekst til en rigtig dato/tid, så vi kan regne tidsforskelle korrekt.
String to Date&Time
Opsummerer hvert segment ved at beregne gennemsnit for Recency, Frequency og Monetary samt giver et samlet overblik over forskelle mellem klyngerne. Tabellen bruges til at identificere de mest værdifulde kunder og ‘ripe’ segmenter til marketing.
GroupBy
Beholder kun de kolonner, vi skal bruge til RFM-segmenteringen (CustomerID, RecencyDays, Frequency og Monetary), så modellen kun bygger på RFM-mål som opgaven kræver.
Column Filter
Normaliserer RFM-variablerne med z-score, så de kommer på samme skala. Det gør, at Monetary ikke dominerer segmenteringen, og at R, F og M vægtes mere balanceret i k-means.
Normalizer
Sorter
Bar Chart

Nodes

Extensions

Links