Icon

JKI2_​002_​Segmentation_​of_​Credit_​Card_​Users

Just KNIME It! Season2
の第2回課題に回答しました。

https://www.knime.com/just-knime-it

Just KNIME It! Season2課題2: クレジットカード利用者の区分けレベル: 中程度説明: クレジットカード会社ABCは、顧客の購入と支払いに関する情報を管理しています。この情報は、個々の顧客について、「支払い情報」と「購入情報」として入手可能です。会社は、顧客を3つのクラスターに区分けし、それぞれのクラスターに応じたマーケティングキャンペーンを設計できるようにしたいと考えています。あなたは、両情報を合わせて使用し、顧客を適切にセグメント化するクラスタリングモデルを構築するよう求められています。同じクラスターに属する顧客は、どのようなパターンに共通しているのでしょうか?また、新規登録されたお客様の情報もあります。学習済みのクラスタリングモデルを使用して、新規登録された顧客にクラスタラベルを割り当て、その結果をCSVファイルにエクスポートするよう求められます。割り当てたラベルは意味があるのか?また、その品質はどのように評価しますか?サンプルデータ:https://www.kaggle.com/datasets/arjunbhasin2013/ccdata 【補足】データ確認用WF 01_データ読込と新規ではない顧客データでのk-Meanクラスタリング 03_新規顧客のクラスタリング実施と特徴の確認 02_新規ではない顧客データでのクラスタリング別の特徴を探索 基本統計量算出CC GENERAL.csv空白値はなくすMINIMUM_PAYMENTS:空白あれば"0"CREDIT_LIMIT:空白あれば平均値正規化3つのクラスターへ分類MINIMUM_PAYMENTSデータがなかった顧客を新規顧客と考えるデータ分割上:非新規8637名下:新規非新規顧客データでのクラスタリングモデルを使って新規顧客の分類を実施クラスター別に色付けクラスター別の色付け定義クラスター別PURCHASES_FREQUENCY(購入頻度) : How frequently the Purchases are being made, score between 0 and 1 (1 = frequently purchased, 0 = not frequently purchased)正規化を元へ戻すNew_Customer_Segmentation.csv正規化を元へ戻すクラスター別TENURE(保有期間) : Tenure of credit card service for userクラスター別PURCHASES_FREQUENCY(購入頻度) : How frequently the Purchases are being made, score between 0 and 1 (1 = frequently purchased, 0 = not frequently purchased)クラスター別TENURE(保有期間) : Tenure of credit card service for user分布比較用(初期設定は購入頻度と保有期間)クラスター別に顧客数と各種平均値算出クラスター別に特徴的なカラムを絞り込みクラスター間で各種平均値を比較クラスター別に特徴的なカラムを絞り込みクラスター別に顧客数と各種平均値算出 Statistics CSV Reader Missing Value Normalizer (PMML) k-Means Row Splitter Reference RowSplitter Cluster Assigner Color Appender Color Manager Scatter Plot Denormalizer (PMML) CSV Writer Denormalizer (PMML) Scatter Plot Scatter Plot Scatter Plot Scatter Plot GroupBy Column Filter Table View Column Filter GroupBy Just KNIME It! Season2課題2: クレジットカード利用者の区分けレベル: 中程度説明: クレジットカード会社ABCは、顧客の購入と支払いに関する情報を管理しています。この情報は、個々の顧客について、「支払い情報」と「購入情報」として入手可能です。会社は、顧客を3つのクラスターに区分けし、それぞれのクラスターに応じたマーケティングキャンペーンを設計できるようにしたいと考えています。あなたは、両情報を合わせて使用し、顧客を適切にセグメント化するクラスタリングモデルを構築するよう求められています。同じクラスターに属する顧客は、どのようなパターンに共通しているのでしょうか?また、新規登録されたお客様の情報もあります。学習済みのクラスタリングモデルを使用して、新規登録された顧客にクラスタラベルを割り当て、その結果をCSVファイルにエクスポートするよう求められます。割り当てたラベルは意味があるのか?また、その品質はどのように評価しますか?サンプルデータ:https://www.kaggle.com/datasets/arjunbhasin2013/ccdata 【補足】データ確認用WF 01_データ読込と新規ではない顧客データでのk-Meanクラスタリング 03_新規顧客のクラスタリング実施と特徴の確認 02_新規ではない顧客データでのクラスタリング別の特徴を探索 基本統計量算出CC GENERAL.csv空白値はなくすMINIMUM_PAYMENTS:空白あれば"0"CREDIT_LIMIT:空白あれば平均値正規化3つのクラスターへ分類MINIMUM_PAYMENTSデータがなかった顧客を新規顧客と考えるデータ分割上:非新規8637名下:新規非新規顧客データでのクラスタリングモデルを使って新規顧客の分類を実施クラスター別に色付けクラスター別の色付け定義クラスター別PURCHASES_FREQUENCY(購入頻度) : How frequently the Purchases are being made, score between 0 and 1 (1 = frequently purchased, 0 = not frequently purchased)正規化を元へ戻すNew_Customer_Segmentation.csv正規化を元へ戻すクラスター別TENURE(保有期間) : Tenure of credit card service for userクラスター別PURCHASES_FREQUENCY(購入頻度) : How frequently the Purchases are being made, score between 0 and 1 (1 = frequently purchased, 0 = not frequently purchased)クラスター別TENURE(保有期間) : Tenure of credit card service for user分布比較用(初期設定は購入頻度と保有期間)クラスター別に顧客数と各種平均値算出クラスター別に特徴的なカラムを絞り込みクラスター間で各種平均値を比較クラスター別に特徴的なカラムを絞り込みクラスター別に顧客数と各種平均値算出Statistics CSV Reader Missing Value Normalizer (PMML) k-Means Row Splitter Reference RowSplitter Cluster Assigner Color Appender Color Manager Scatter Plot Denormalizer (PMML) CSV Writer Denormalizer (PMML) Scatter Plot Scatter Plot Scatter Plot Scatter Plot GroupBy Column Filter Table View Column Filter GroupBy

Nodes

Extensions

Links