Icon

Forum 10

SOAL 1 - Dampak Penghapusan Outlier Interpretasi dampak bisnis:

• Menghapus outlier membuat rata-rata Revenue lebih representatif untuk penjualan normal.

• Jika outlier sangat tinggi, mean sebelum cleaning cenderung terlalu besar.

• Setelah cleaning, analisis performa produk/kategori menjadi lebih stabil.

• Tapi outlier juga bisa merepresentasikan transaksi besar yang penting, jadi jangan langsung dibuang tanpa konteks bisnis.

SOAL - 2 Analisis Korelasi Linear terhadap Performance

Interpretasi hasil:
• Linear Correlation digunakan untuk melihat hubungan antara fitur input dengan Performance.
• Fitur dengan korelasi kuat adalah fitur yang memiliki nilai korelasi lebih dari |0.7|.
• Age, Experience, Training_Hours, dan Projects memiliki korelasi kuat terhadap Performance.
• Age, Experience, dan Projects memiliki korelasi positif, artinya semakin besar nilainya maka Performance cenderung meningkat.
• Training_Hours memiliki korelasi negatif, artinya pada dataset ini semakin tinggi jam training, Performance cenderung lebih rendah
• Fitur dengan korelasi kuat dapat digunakan sebagai input untuk membuat model prediksi Performance.

SOAL - 3 Segmentasi Pelanggan K-Means

Interpretasi hasil:
• K-Means digunakan untuk membagi pelanggan menjadi 3 cluster.
• Variabel yang digunakan adalah Age, Income, dan Spending_Score.
• Cluster_0 berisi pelanggan dengan income dan spending menengah.
• Cluster_1 berisi pelanggan dengan income tinggi tetapi spending rendah.
• Cluster_2 berisi pelanggan muda dengan income rendah tetapi spending tinggi.
• Hasil segmentasi ini dapat membantu perusahaan membuat strategi pemasaran yang berbeda untuk setiap kelompok pelanggan.

SOAL - 4 Prediksi House Price dengan Linear Regression

Interpretasi hasil:

• Linear Regression digunakan untuk memprediksi harga rumah berdasarkan fitur input.

• Dataset House_Price.csv berisi Size_m2, Rooms, Distance_to_City, dan Price.

• Kolom ID tidak digunakan karena hanya sebagai nomor urut data.

• Data dibagi menjadi 70% training dan 30% testing menggunakan Table Partitioner.

• Data training digunakan untuk membangun model regresi linear.

• Data testing digunakan untuk menguji hasil prediksi model.

• Regression Predictor menghasilkan kolom Prediction (Price).

• Numeric Scorer digunakan untuk mengevaluasi model dengan R² dan RMSE.

• Pada hasil evaluasi, R² = -1 dan RMSE = 21.213.

• R² negatif menunjukkan model belum mampu memprediksi dengan baik.

• Hal ini terjadi karena jumlah dataset sangat sedikit, yaitu hanya 6 data.

SOAL - 5 What-if Analysis Production

Interpretasi hasil:

• Profit awal dihitung menggunakan rumus Revenue - Cost.

• Simulasi dilakukan dengan menaikkan Cost sebesar 10%.

• Cost setelah simulasi dihitung dengan rumus Cost * 1.1.

• Profit baru dihitung dari Revenue - Cost_Naik_10.

• Total Profit awal adalah 2500.

• Total Profit setelah Cost naik 10% adalah 2120.

• Profit turun sebesar 380 atau sekitar 15.2%.

• Kenaikan biaya bahan berdampak pada penurunan profit.

• Rekomendasi: perusahaan perlu melakukan efisiensi biaya, negosiasi harga bahan, atau menyesuaikan harga jual.

Membaca dataset Sales_Data.csvberisi data Product, Category,Revenue, dan Quantity.
CSV Reader
Menghitung statistik awal,termasuk rata-rata Revenuesebelum outlier dihapus.
Statistics
Menghitung Profit awalRevenue - Cost
Math Formula
Menandai data Revenuesebagai Normal atau Outlierberdasarkan batas IQR.
Rule Engine
Menyaring data dan hanyamengambil baris dengan statusNormal.
Row Filter
Menghitung rata-rata Revenuesetelah data outlier dihapus.
Statistics
Membaca datasetEmployee_Performance.csv
CSV Reader
Menghitung korelasiantara fitur inputdengan Performance
Linear Correlation
Simulasi Cost naik 10%Cost * 1.1
Math Formula
Membagi pelangganmenjadi 3 clusterberdasarkan pola data
k-Means
Menghitung Profit barusetelah Cost naik 10%
Math Formula
Membaca datasetCustomer_Segmentation.csv
CSV Reader
Membagi data menjadi70% training dan30% testing
Table Partitioner
Menghapus kolom IDagar tidak ikut prosesclustering
Column Filter
Membaca datasetHouse_Price.csv
CSV Reader
Menghitung total Profitsebelum dan sesudahsimulasi
GroupBy
Menghapus kolom IDagar tidak ikut prosesprediksi
Column Filter
Evaluasi model denganR² dan RMSE
Numeric Scorer
Membaca datasetProduction.csv
CSV Reader
Membangun modelregresi linear untukmemprediksi Price
Linear Regression Learner
Memprediksi Pricepada data testing
Regression Predictor

Nodes

Extensions

Links