Icon

Bank_​Marketing

SMOTE

DESICION TREE

CROSS VALIDATION

OPTIMATATION

ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ

Ο κόμβος CSV Reader χρησιμοποιείται για τη φόρτωση του dataset στο περιβάλλον του KNIME, αποτελώντας το αρχικό βήμα της διαδικασίας.
CSV Reader
Ο κόμβος Missing Value εφαρμόζεται για την αντιμετώπιση των ελλιπών τιμών, ώστε να διασφαλιστεί η ποιότητα των δεδομένων και η σωστή λειτουργία του μοντέλου.
Missing Value
Ο κόμβος Normalizer (Apply) εφαρμόζει την ίδια κανονικοποίηση στο test set, εξασφαλίζοντας συνέπεια μεταξύ training και test δεδομένων.
Normalizer (Apply)
Ο κόμβος One to Many μετατρέπει τις κατηγορικές μεταβλητές σε αριθμητική μορφή μέσω one-hot encoding, καθώς τα μοντέλα μηχανικής μάθησης απαιτούν αριθμητικά δεδομένα.
One to Many
Ο κόμβος Table Partitioner διαχωρίζει τα δεδομένα σε training και test set, επιτρέποντας την αξιόπιστη αξιολόγηση του μοντέλου σε άγνωστα δεδομένα.
Table Partitioner
Ο κόμβος Decision Tree Learner εκπαιδεύει το μοντέλο δέντρου αποφάσεων με βάση τα training δεδομένα.
Decision Tree Learner
Ο κόμβος Decision Tree Predictor χρησιμοποιείται για την εφαρμογή του εκπαιδευμένου μοντέλου στα test δεδομένα και την παραγωγή προβλέψεων.
Decision Tree Predictor
Ο κόμβος Scorer υπολογίζει τις μετρικές απόδοσης και δημιουργεί το confusion matrix, επιτρέποντας την αξιολόγηση της αποτελεσματικότητας του μοντέλου.
Scorer
Ο κόμβος SMOTE χρησιμοποιείται για την εξισορρόπηση των κλάσεων δημιουργώντας τεχνητά δείγματα της μειοψηφικής κλάσης, βελτιώνοντας έτσι την ικανότητα του μοντέλου να την αναγνωρίζει.
SMOTE
Decision Tree Learner
Decision Tree Learner
Decision Tree Predictor
Decision Tree Predictor
Scorer
Parameter Optimization Loop Start (Table)
Scorer
Parameter Optimization Loop End
Ο κόμβος Decision Tree Learner εκπαιδεύει το μοντέλο σε κάθε fold χρησιμοποιώντας το αντίστοιχο training subset, επιτρέποντας την εκμάθηση από διαφορετικά υποσύνολα δεδομένων.
Decision Tree Learner
Table Creator
Ο κόμβος Value Counter χρησιμοποιείται για την ανάλυση της κατανομής της μεταβλητής στόχου, με σκοπό τον εντοπισμό πιθανής ανισορροπίας μεταξύ των κλάσεων.
Value Counter
Ο κόμβος Scorer χρησιμοποιείται για τον υπολογισμό των τελικών μετρικών απόδοσης και του confusion matrix, επιτρέποντας τη συνολική αξιολόγηση του μοντέλου μετά την ολοκλήρωση της cross-validation.
Scorer
Ο κόμβος X-Partitioner χρησιμοποιείται για την εφαρμογή της μεθόδου cross-validation, χωρίζοντας τα δεδομένα σε πολλαπλά folds ώστε κάθε τμήμα να χρησιμοποιείται εναλλάξ για εκπαίδευση και αξιολόγηση.
X-Partitioner
Ο κόμβος Group Loop Start χρησιμοποιείται για την ομαδοποίηση των αποτελεσμάτων (π.χ. ανά fold ή μετρική), διευκολύνοντας την περαιτέρω ανάλυση και σύγκριση.
Group Loop Start
Ο κόμβος Decision Tree Predictor εφαρμόζει το εκπαιδευμένο μοντέλο στο validation fold, παράγοντας προβλέψεις για δεδομένα που δεν έχουν χρησιμοποιηθεί στην εκπαίδευση.
Decision Tree Predictor
Ο κόμβος X-Aggregator συγκεντρώνει τα αποτελέσματα από όλα τα folds, υπολογίζοντας τις μέσες τιμές των μετρικών και παρέχοντας μια πιο αξιόπιστη εκτίμηση της απόδοσης του μοντέλου.
X-Aggregator
Ο κόμβος GroupBy χρησιμοποιείται για τον υπολογισμό των μέσων τιμών των μετρικών (Mean Accuracy, Mean Precision, Mean Recall, Mean F1-score), παρέχοντας μια συνολική και πιο αξιόπιστη εκτίμηση της απόδοσης του μοντέλου.
GroupBy
Ο κόμβος Normalizer εφαρμόζει κανονικοποίηση στα χαρακτηριστικά, ώστε όλα τα δεδομένα να βρίσκονται στην ίδια κλίμακα και να βελτιώνεται η απόδοση του μοντέλου.
Normalizer
Ο κόμβος Scorer εφαρμόζεται για τον υπολογισμό συγκεντρωτικών μετρικών, συμβάλλοντας στη συνολική αξιολόγηση της απόδοσης του μοντέλου.
Scorer
Ο κόμβος Loop End ολοκληρώνει τη διαδικασία του loop, συγκεντρώνοντας τα αποτελέσματα όλων των επαναλήψεων σε έναν ενιαίο πίνακα για τελική αξιολόγηση.
Loop End

Nodes

Extensions

Links