Icon

Forum_​Pertemuan10

SOAL 1

Hasil Analisis:

• Outlier berhasil dideteksi menggunakan metode IQR.

• Nilai Revenue yang sangat tinggi menyebabkan rata-rata

menjadi bias.

• Setelah outlier dihapus, rata-rata Revenue menjadi lebih

representatif terhadap kondisi mayoritas data.

Interpretasi:

• Outlier dapat menyebabkan analisis bisnis menjadi tidak akurat.

• Prediksi penjualan dan evaluasi kinerja dapat terdistorsi.

• Penghapusan outlier membantu menghasilkan insight yang lebih stabil.

Dampak Bisnis:

1. Analisis menjadi lebih realistis.

2. Mengurangi bias pada pengambilan keputusan.

3. Membantu estimasi penjualan yang lebih akurat.

SOAL 2

Hasil Analisis:

• Analisis korelasi digunakan untuk mengetahui fitur

yang paling mempengaruhi Performance.

• Fitur dengan nilai korelasi > |0,7| dianggap memiliki

hubungan kuat.

Interpretasi:

• Experience memiliki korelasi positif yang kuat terhadap Performance.

• Projects juga menunjukkan hubungan positif terhadap Performance.

• Training_Hours memiliki pengaruh lebih kecil dibanding Experience.

Pemanfaatan:

1. Fitur berkorelasi tinggi dapat digunakan sebagai predictor.

2. Membantu meningkatkan akurasi model prediksi kinerja.

3. Menjadi dasar dalam evaluasi dan pengembangan karyawan.

SOAL 3

Hasil Analisis:

• Pelanggan berhasil dikelompokkan menjadi 3 klaster.

• Segmentasi dilakukan berdasarkan Age, Income,

dan Spending_Score.

Interpretasi Klaster:

Klaster 1:

• Pendapatan rendah

• Spending score tinggi

• Pelanggan aktif berbelanja

Klaster 2:

• Pendapatan menengah

• Pengeluaran sedang

• Pelanggan reguler

Klaster 3:

• Pendapatan tinggi

• Spending score rendah

• Pelanggan potensial yang belum optimal

Rekomendasi:

1. Berikan promosi khusus pada Klaster 1.

2. Pertahankan loyalitas Klaster 2.

3. Tingkatkan engagement Klaster 3.

SOAL 4

Hasil Analisis:

• Data dibagi menjadi 70% training dan 30% testing.

• Model regresi linear digunakan untuk memprediksi

harga rumah berdasarkan Size_m2, Rooms,

dan Distance_to_City.

Hasil Evaluasi:

• R² = 0.821

• RMSE = 25.804

Interpretasi:

• Nilai R² sebesar 0.821 menunjukkan bahwa

sekitar 82,1% variasi harga rumah dapat

dijelaskan oleh model.

• Nilai RMSE sebesar 25.804 menunjukkan bahwa

rata-rata kesalahan prediksi model sekitar

25,8 satuan harga.

• Hasil ini menunjukkan bahwa model memiliki

performa yang baik dalam memprediksi harga rumah.

Pengaruh Variabel:

• Size_m2 berpengaruh positif terhadap harga rumah.

• Semakin banyak Rooms, harga rumah cenderung meningkat.

• Distance_to_City juga mempengaruhi harga rumah

sesuai pola yang dipelajari model.

Kesimpulan:

1. Model regresi memiliki akurasi yang baik.

2. Nilai R² > 0.8 menunjukkan kemampuan prediksi yang kuat.

3. Model dapat digunakan untuk estimasi harga rumah

pada data yang serupa.

SOAL 5

Hasil Analisis:

• Profit awal dihitung dari Revenue - Cost.

• Setelah biaya naik 10%, profit seluruh produk menurun.

• Total profit awal = 2500.

• Total profit setelah simulasi = 2120.

• Terjadi penurunan profit sebesar 380 atau 15,2%.

Interpretasi:

• Kenaikan biaya bahan baku berdampak langsung

terhadap penurunan laba perusahaan.

• Margin keuntungan menjadi lebih kecil.

• Produk dengan biaya tinggi mengalami dampak terbesar.

Rekomendasi Efisiensi:

1. Evaluasi pemasok bahan baku.

2. Kurangi pemborosan selama proses produksi.

3. Tingkatkan efisiensi operasional.

4. Fokus pada produk dengan margin tinggi.

5. Pertimbangkan penyesuaian harga jual.

Memuat dataset Sales_Data.csv.
CSV Reader
Menampilkan statistik Revenue sebelum pembersihan data.
Statistics
Memuat dataset Production.csv.
CSV Reader
Menghitung rata-rata Revenue sebelum penghapusan outlieruntuk dijadikan pembanding.
GroupBy
Mendeteksi outlier pada kolom Revenue menggunakan metodeIQR (Interquartile Range).
Numeric Outliers
Menghitung rata-rata Revenue setelah outlier dihapus.
GroupBy
Menampilkan statistik Revenue setelah pembersihan data.
Statistics
Memuat dataset Employee_Performance.csv.
CSV Reader
Menghitung profit awal:Profit = Revenue - Cost
Math Formula
Memuat dataset Customer_Segmentation.csv.
CSV Reader
Mensimulasikan kenaikan biaya bahan baku sebesar 10%.
Math Formula
Menghapus kolom ID dan memilih variabel numerikyang akan dianalisis korelasinya.
Column Filter
Mengelompokkan pelanggan ke dalam3 klaster berdasarkan pola pembelian.
k-Means
Memuat dataset House_Price.csv
CSV Reader
Menghitung korelasi antara fitur input denganvariabel Performance.
Linear Correlation
Memilih fitur numerik yang digunakanuntuk proses clustering.
Column Filter
Menghitung profit setelah kenaikan biaya:New Profit = Revenue - Cost_10pct
Math Formula
Melakukan normalisasi data agar seluruhvariabel memiliki skala yang seimbang.
Normalizer
Menghitung total profit awal dan profitsetelah simulasi kenaikan biaya.
Statistics
Menghasilkan prediksi harga rumahberdasarkan model regresi yang telah dibuat.
Regression Predictor
Mengevaluasi performa model menggunakanR² dan RMSE.
Numeric Scorer
Membagi dataset menjadi 70% data trainingdan 30% data testing untuk proses evaluasi model.
Table Partitioner
Membangun model regresi linear menggunakanSize_m2, Rooms, dan Distance_to_Citysebagai variabel prediktor.
Linear Regression Learner

Nodes

Extensions

Links