Icon

Ex1

Linear Regression - solution

Introduction to Machine Learning Algorithms course - Session 2
Solution to exercise 1
- Partition data into training and test set
- Train a linear regression model
- Apply the trained model to the test set
- Handle missing values
- Evaluate the model performance with the Numeric Scorer node

URL: The Learner-Predictor construct in KNIME https://www.youtube.com/watch?v=bKrJkdPvpeA
URL: Slides (Introduction to ML Algorithm course) https://www.knime.com/form/material-download-registration

Πρόβλεψη Τιμών Κατοικίας με 1) Μοντέλο Γραμμικής Παλινδρόμησης (Linear Regression) και 2) Δεντρο Παλινδρομησης Regression Tree)

Προβλέψη της τιμής μιας κατοικίας στο Ames (Αϊόβα, ΗΠΑ) βασιζόμενοι σε μια σειρά χαρακτηριστικών: μέγεθος & ποιότητα
Βηματα:
1. Φόρτωση των δεδομένων με τον κόμβο CSV reader
2. Απεικόνιση της στοχευόμενης μεταβλητής έναντι άλλων μεταβλητών με τον κόμβο Scatter Plot
3. Διαίρεση των δεδομένων σε Training (70%) και test (30%) dataset
4. Εκπαίδευση ενός μοντέλου γραμμικής παλινδρόμησης με τον κόμβο Linear Regression Learner
5. Δημιουργία προβλέψεων με τον κόμβο Regression Predictor
6. Αφαίρεση των ελλειπόντων προβλέψεων με τον κόμβο Missing Value
7. Αξιολόγηση της απόδοσης του μοντέλου με τον κόμβο Numeric Scorer
8. Επαναλεβετε τα προηγουμενα βηματα για ενα μοντελο Regression Tree.
9. Βελτιστοποιηστε το Regression Tree Model με ενα Optimization Loop. Μεταβαλλετε το tree depth απο 2 εως 10 και το minimum split node size πο 1 εως 10. Η βελτιστοποιηση θα εχει στοχο την μεγιστοποιηση της μετρικης R2. Υποδειξη: Στον κομβο Νumeric Scorer ενεργοποιηστε την επιλογη: Output scorew as flow variables.
10. Ποιο μοντελο εχει την καλυτερη αποδοση;

Model 1: Linear Regression

Model 2: Regression Tree

Model 3: Regression Tree Optimization

Προβεψεις με βαση το trained model
Simple Regression Tree Predictor
Εκτιμηση της αποδοσης του μοντελου
Numeric Scorer
Removing missing predictions
Missing Value
Training linearregression model
Linear Regression Learner
Sale price vs other variables
Scatter Plot (JavaScript) (legacy)
Προβεψεις με βαση το trained model
Regression Predictor
Training Regression tree
Simple Regression Tree Learner
Βροχος Βελτιστοποιησης
Parameter Optimization Loop Start
Εκτιμηση της αποδοσης του μοντελου
Numeric Scorer
Removing missing predictions
Missing Value
Συλλογη βελτιστων τιμων
Parameter Optimization Loop End
Εκτιμηση της αποδοσης του μοντελου
Numeric Scorer
Training Regression tree
Simple Regression Tree Learner
housing dataset
CSV Reader
Προβεψεις με βαση το trained model
Simple Regression Tree Predictor
Removing missing predictions
Missing Value
Training - 70% Testing - 30%
Table Partitioner

Nodes

Extensions

Links