ANOVA (Numerische Features) :
Ein statistischer Test (Analysis of Variance) zur Prüfung, ob sich die Mittelwerte eines numerischen Merkmals (z. B. Tenure, MonthlyCharges) signifikant zwischen den Churn-Gruppen unterscheiden.
Nullhypothese (H0): Die Mittelwerte der Gruppen sind identisch (Das Merkmal verhält sich bei Churnern und Nicht-Churnern gleich).
Ein p-Wert < 0.05 verwirft H0. Es gibt einen signifikanten Unterschied im Verhalten des Merkmals zwischen den Gruppen.
Ergebnis: lle drei numerischen Merkmale (Tenure, MonthlyCharges, TotalCharges) weisen einen p-Wert von < 0.05 auf.Es gibt einen signifikanten Unterschied in den Mittelwerten zwischen abgewanderten und gebliebenen Kunden. Alle drei Merkmale sind statistisch relevante Prädiktoren und werden für die Modellierung in Betracht gezogen.
Korrelations-Analyse:
Analyse der Abhängigkeiten zwischen den numerischen unabhängigen Variablen, um Redundanzen zu identifizieren.
Ergebnis Korrelations-Analyse: Die Analyse bestätigt eine starke Multikollinearität (r ≈ 0.83) zwischen Tenure und TotalCharges. Da die Gesamtkosten (TotalCharges) direkt von der Laufzeit (Tenure) abhängen, liefern sie kaum neue Informationen, sondern blähen das Modell nur auf. TotalCharges wird aus dem Feature-Set entfernt. Das Modell trainiert nur mit Tenure und MonthlyCharges, um Stabilität zu gewährleisten.