Icon

Association A priori, Clustering K-means, Classification Decision Tree train and deploy sib6nf

This workflow contains three different methods applied to a single dataset named "Netflix Titles": association (using the Apriori algorithm), clustering (using K-means), and classification (using Decision Tree).

Each method serves a different purpose. The association method is used for identifying relationships between different attributes within the data, the clustering method groups similar items together, and the classification method predicts the category of new data entries. This data is intended for film companies looking to produce new films or individuals seeking to find similar movies to those they have already watched.

This dataset was provided by the Academy and analysis and workflow were created by Group 5 Kelompok 7 SIB Batch 6 at the Nurul Fikri Academy ACDS


Members :

1.Aris Saparudin
2.Leohafs Sri Indrapura R Zain
3.Fahri Prastyo
4.Rika Karmila
5.Mufidah Anjani Zarifah

Data Preparation Algoritma (Asosiasi) Evaluation Clustering Visualisasi Prepocessing Data Import Sedikit penjelasan terkait 3 metode ini Metode yang pertama Asosiasi digunakan untuk mencari pola tertentu dalam 4 kolom, misal adanya kecocokandiantara koleksi item, misalkan pada genre comedy, biasanya juga terdapat genre romance, ataupun negara Abiasanya memproduksi film Movie Thriller (misalkan), bisa digunakan oleh perusahaan yang ingin membuat filmMetode yang kedua adalah klustering, mengelompokan beberapa genre kedalam satu kluster, disini terdapat 12genre, seperti action, anime, dan lain - lain, di akhir juga kita menggunakan scatteer plot untuk melihat tahunberapa kebanyakan genre tersebut muncul, dapat digunakan oleh seseorang yang ingin menonton film yangserupa dengan yang pernah ia tonton.Metode yang ketiga adalah Klasifikasi, gunanya untuk mengklasifikasikan type film berdasarkan tahun rilis.Tujuan untuk memprediksi tahun rilis sebelum dan sesudah 2018 lebih dominan film atau tv show agarperusahaan dapat menentukan apa yang akan dirilis selanjutnya Data Preparation Data Preparation Data Preparation Menggabungkan beberapakolom kedalam satu group untuk aggregasiMenghapus data yang kosongkarna kurang informasiMembuat beberapa kolommenjadi satu kolom yangberisi koleksi itemMencari kecocokan polapada data koleksi itemMembuat tampilan resultlebih jelasMenghapus kolom-kolomyang tidak diperlukanmemfilter type,country, release year,listed_inlisted_inAscendingMengubahlisted_inmenjadi binerMengklaster datamengubahtype string menjadinumber padalisted_inMenghapus missing valueNetflix_titles1.csvAssign ClusteringMemberi warnake masing2 clusteringMemvisualisasidataNode 35Node 51MemfilterkolomMenghapusbaris duplikatmembagi data80 belajar dan20 pengujianmemberi warnakolom typegantiMissing valuemenjadi UnknownNode 57 GroupBy Missing Value Create CollectionColumn AssociationRule Learner Table View(JavaScript) Column Filter Column Filter Sorter String Manipulation k-Means String to Number Missing Value CSV Reader Cluster Assigner Color Manager Scatter Plot Scorer DecisionTree Learner Column Filter DuplicateRow Filter Partitioning Color Manager Missing Value Decision TreePredictor Data Preparation Algoritma (Asosiasi) Evaluation Clustering Visualisasi Prepocessing Data Import Sedikit penjelasan terkait 3 metode ini Metode yang pertama Asosiasi digunakan untuk mencari pola tertentu dalam 4 kolom, misal adanya kecocokandiantara koleksi item, misalkan pada genre comedy, biasanya juga terdapat genre romance, ataupun negara Abiasanya memproduksi film Movie Thriller (misalkan), bisa digunakan oleh perusahaan yang ingin membuat filmMetode yang kedua adalah klustering, mengelompokan beberapa genre kedalam satu kluster, disini terdapat 12genre, seperti action, anime, dan lain - lain, di akhir juga kita menggunakan scatteer plot untuk melihat tahunberapa kebanyakan genre tersebut muncul, dapat digunakan oleh seseorang yang ingin menonton film yangserupa dengan yang pernah ia tonton.Metode yang ketiga adalah Klasifikasi, gunanya untuk mengklasifikasikan type film berdasarkan tahun rilis.Tujuan untuk memprediksi tahun rilis sebelum dan sesudah 2018 lebih dominan film atau tv show agarperusahaan dapat menentukan apa yang akan dirilis selanjutnya Data Preparation Data Preparation Data Preparation Menggabungkan beberapakolom kedalam satu group untuk aggregasiMenghapus data yang kosongkarna kurang informasiMembuat beberapa kolommenjadi satu kolom yangberisi koleksi itemMencari kecocokan polapada data koleksi itemMembuat tampilan resultlebih jelasMenghapus kolom-kolomyang tidak diperlukanmemfilter type,country, release year,listed_inlisted_inAscendingMengubahlisted_inmenjadi binerMengklaster datamengubahtype string menjadinumber padalisted_inMenghapus missing valueNetflix_titles1.csvAssign ClusteringMemberi warnake masing2 clusteringMemvisualisasidataNode 35Node 51MemfilterkolomMenghapusbaris duplikatmembagi data80 belajar dan20 pengujianmemberi warnakolom typegantiMissing valuemenjadi UnknownNode 57 GroupBy Missing Value Create CollectionColumn AssociationRule Learner Table View(JavaScript) Column Filter Column Filter Sorter String Manipulation k-Means String to Number Missing Value CSV Reader Cluster Assigner Color Manager Scatter Plot Scorer DecisionTree Learner Column Filter DuplicateRow Filter Partitioning Color Manager Missing Value Decision TreePredictor

Nodes

Extensions

Links