Icon

JKI2_​009_​What_​Matters_​for_​Wine_​Quality

Just KNIME It! Season2
の第9回課題に回答しました。

https://www.knime.com/just-knime-it

Just KNIME It! Season2課題9: ワインの品質には何が必要なのか?レベル:説明: この課題では、ワインの品質を予測する上で、どの特徴量が最も重要であるかを確認することが目標です。この分析を行った後、特徴量の重要度を順番に示すビジュアライゼーションを作成する必要があります。サンプルデータ:https://hub.knime.com/alinebessa/spaces/Just%20KNIME%20It!%20Season%202%20-%20Datasets/latest/Challenge%2009%20-%20Dataset~luu41yVfm8TlYB2E/ ① データの観察今回は前処理不要と判断 ② 機械学習モデルスクリーニングAutoMLで最適モデル選定とそのハイパーパラメータ最適化を実施 解答: ランダムフォレスト(RF)での回帰モデル作成と特徴量の重要度順ビジュアライゼーション execute up-streambefore configurationwinequality-red.csvデータの分布を観察Top : Train + Validation setsBottom : Test setランダムに8:2に分けるランダムシードを変えると最適モデルや予測精度なども変化するので注意PredictFlowVariablesを見てRFとそのハイパーパラメータを採用四捨五入して整数値へ高い精度ではないがAutoMLですら改善困難と判断上記②の結果をもとに条件設定予測の実施コメント:AutoMLと設定を揃えたつもりだが精度がより低い理由は不明だが興味深い四捨五入して整数値へ特徴量の重要度算出$#splits (level 0)$/$#candidates (level 0)$+$#splits (level 1)$/$#candidates (level 1)$+$#splits (level 2)$/$#candidates (level 2)$重要度の高い順BarChartノードでの特徴量ごとでの集計のため特徴量名のカラムを追加棒グラフで重要度の高い順に特徴量を並べて可視化 AutoML (Regression) CSV Reader Statistics Partitioning Workflow Executor Round Double Numeric Scorer Random Forest Learner(Regression) Random Forest Predictor(Regression) Numeric Scorer Round Double Math Formula Sorter RowID Bar Chart Just KNIME It! Season2課題9: ワインの品質には何が必要なのか?レベル:説明: この課題では、ワインの品質を予測する上で、どの特徴量が最も重要であるかを確認することが目標です。この分析を行った後、特徴量の重要度を順番に示すビジュアライゼーションを作成する必要があります。サンプルデータ:https://hub.knime.com/alinebessa/spaces/Just%20KNIME%20It!%20Season%202%20-%20Datasets/latest/Challenge%2009%20-%20Dataset~luu41yVfm8TlYB2E/ ① データの観察今回は前処理不要と判断 ② 機械学習モデルスクリーニングAutoMLで最適モデル選定とそのハイパーパラメータ最適化を実施 解答: ランダムフォレスト(RF)での回帰モデル作成と特徴量の重要度順ビジュアライゼーション execute up-streambefore configurationwinequality-red.csvデータの分布を観察Top : Train + Validation setsBottom : Test setランダムに8:2に分けるランダムシードを変えると最適モデルや予測精度なども変化するので注意PredictFlowVariablesを見てRFとそのハイパーパラメータを採用四捨五入して整数値へ高い精度ではないがAutoMLですら改善困難と判断上記②の結果をもとに条件設定予測の実施コメント:AutoMLと設定を揃えたつもりだが精度がより低い理由は不明だが興味深い四捨五入して整数値へ特徴量の重要度算出$#splits (level 0)$/$#candidates (level 0)$+$#splits (level 1)$/$#candidates (level 1)$+$#splits (level 2)$/$#candidates (level 2)$重要度の高い順BarChartノードでの特徴量ごとでの集計のため特徴量名のカラムを追加棒グラフで重要度の高い順に特徴量を並べて可視化 AutoML (Regression) CSV Reader Statistics Partitioning Workflow Executor Round Double Numeric Scorer Random Forest Learner(Regression) Random Forest Predictor(Regression) Numeric Scorer Round Double Math Formula Sorter RowID Bar Chart

Nodes

Extensions

Links