Solution

Εφαρμοστε SMOTE ΜΟΝΟ στο training dataset με oversample minority classes

Ελεγκτε την κλατανομη των κλασεων με Bar Chart

Εκπαιδευστε με το training dataset ενα decision tree για προβλεψη του risk-level, εφαρμοστε το στο test set, και αξιολογηστε το με το Scorer

Απο τις μετρικες του scorer υπολογιστε macro & micro averaging στην F1, τι παρατηρητε;

Τι συμβαινει με για την περιπτωση risk-level=high

Συγκρινεται με την προηγουμενη περιπτωση

Nodes