Mögliche Hypothesen:
H1: Produktdiversität erhöht den Kundenumsatz.
Kunden, die eine höhere Produkt- und Markenvielfalt in ihrem Warenkorb aufweisen, generieren einen signifikant höheren Gesamtumsatz als Kunden mit geringer Produkt- und Markenvielfalt.
Begründung aus den Clustern:
Cluster 2 und 4: hohe Produktanzahl (~39), viele Marken (~6), hoher Umsatz (~336–337)
Cluster 0 und 1: niedrigere Produktanzahl (~26–29), weniger Marken (~4), niedriger Umsatz (~224)
H2: Clusterbezogene Hypothese
Der Kundenumsatz wird signifikant durch die Anzahl gekaufter Produkte, die gewährten Rabatte sowie die Präferenz bestimmter Schokoladensorten beeinflusst, wobei Kunden mit höherer Produktanzahl, höherer Markenvielfalt und spezifischen Produktpräferenzen (z. B. Praline-, Trüffel- oder Premiumprodukte) höhere Umsätze erzielen.
Inhaltliche Erwartung: Kunden mit höherem Umsatz kaufen tendenziell mehr Produkte, weisen eine höhere Markenvielfalt auf und zeigen stärkere Präferenzen für bestimmte Schokoladensorten, während Rabatte nur einen geringen Einfluss auf den Umsatz haben.
Produktanzahl und Umsatz:
Cluster_2 und Cluster_4: Höchste durchschnittliche Umsätze (Umsatz ≈ 337, Produktanzahl ≈ 39–40)
Cluster_0 und Cluster_1: Geringerer Umsatz und geringere Produktanzahl (Umsatz ≈ 224, Produktanzahl ≈ 26–29)
Markenvielfalt und Umsatz: Umsatzstarke Cluster mit großer Markenvielfalt
Cluster_2 und Cluster_4: etwa 6 Marken
Cluster_0 und Cluster_1: etwa 4 Marken
Rabattstruktur
Die Rabatte unterscheiden sich nur gering (Cluster_0: 0.062, Cluster_2: 0.054, Cluster_4: 0.055)
Schlussfolgerung: Rabatte haben einen geringeren Einfluss auf den Umsatz als andere Variablen.
Präferenz für Schokoladensorten: Kundensegmente mit unterschiedlichen Präferenzen für Schokoladensorten unterscheiden sich signifikant hinsichtlich ihres Umsatzes und ihrer Kaufintensität.
Praline: Anteil ~0,20-0,22, in allen Clustern mit höchstem Anteil, Kernprodukt ohne trennscharfe Wirkung zwischen Segmenten
Truffle: Anteil schwankt stark, Cluster_0: sehr niedrig (~0.035), Cluster_1: deutlich höher (~0.213)
Dark: Cluster_1 mit geringstem Anteil
Milk: Generell niedriger Anteil, wenig Trennschärfe
White: Stabiler Anteil über alle Cluster hinweg, wenig Trennschärfe