Icon

Prediksi GPA Simple Linear Regression

Ini adalah workflow pertama saya di KNIME. Saya mencoba mendokumentasikan setiap node dengan baik supaya bisa memahami fungsi dari setiap node.

Workflow ini akan membangun sebuah model regresi linear yang akan melihat apakah nilai SAT akan berpengaruh terhadap nilai GPA.

Pada workflow ini, akan digunakan regresi linear sederhana yaitu regresi linear dengan menggunakan satu variabel dependen (GPA) dan satu variabel independen (SAT).

URL: Link Download Dataset https://www.kaggle.com/datasets/japondo/simple-linear-regression

Step pertama yang harus dilakukan adalah mengimport data. Untuk mengimport data, kita bisa menggunakan CSV Reader Node.

Scatter Plot Node digunakan untuk melihat bagaimana hubungan diantara variabel sebelum training dilakukan. Apakah hubungannya positif atau negatif.

Line Plot Node digunakan untuk menentukan bagaimana tren hubungan pada dataset.

Statistics View Node digunakan untuk melihat statistik deskriptif dari dataset.

Membagi dataset menjadi 2, yaitu training set dan test set.

Linear Regression Learner digunakan untuk melatih training set.

Regression Predictor Node digunakan untuk membuat prediksi test set.

Numeric Scorer Node digunakan untuk mengevaluasi model linear regression yang sudah dibuat.

Scatter Plot setelah dataset berhasil di training. Scatter plot yang dihasilkan memiliki pola upward sloping yang mengindikasikan bahwa nilai SAT memiliki korelasi positif dengan nilai GPA.

SIMPLE LINEAR REGRESSION WORKFLOW

Mengimport Data
CSV Reader
Melihat Deskripsi Statistik
Statistics View
Melihat Scatter
Scatter Plot
Melihat Line Plot
Line Plot
Membagi Dataset
Table Partitioner
Scatter Plot
Linear Regression Learner
Regression Predictor
Numeric Scorer

Nodes

Extensions

Links