Icon

JKI2_​019_​Dealing_​with_​Diabetes

Just KNIME It! Season2
の第19回課題に回答しました。

https://www.knime.com/just-knime-it

Solving a Classification Task with AutoML下記サイトより入手:https://hub.knime.com/knime/spaces/Examples/latest/09_Enterprise/04_Integrated_Deployment/03_AutoML_Deployment/02_AutoML_Regression_and_Classification_Examples~ifIPg5Pr0hCk62GS Just KNIME It! Season2課題19: 糖尿病との付き合い方レベル: 簡単もしくは中程度説明: このチャレンジでは、あなたは臨床医の役割を担い、機械学習が糖尿病の予測に役立つかどうかをチェックします。ベースラインの精度65%を上回り、両方のクラス(糖尿病である場合と糖尿病でない場合)で非常にうまく機能するソリューションを作成する必要があります。 我々は最小限のワークフローで77%の精度を得ました。もしこのチャレンジを簡単なものから中程度のものにしたいのであれば、下記を実装してみてください:sampling techniqueshttps://hub.knime.com/victor_palacios/spaces/Public/latest/Sampling%20Strategies%20Comparison~ouHL6-Ca44-UK-Wtfeature importance calculationhttps://www.knime.com/blog/understand-ml-model-global-feature-importance Input:0 : Model as a Workflow Object1 : Data from Model Test PartitionOutput:0 : Global Feature ImportancePredictTop : Train + Validation setsBottom : Test setexecute up-streambefore configurationdiabetes.csvOutcomeが判定対象なので文字列データへデータ観察疑問: 例えばBloodPressure = 0ってどういう場合なのだろうか?Global FeatureImportance Select Example DatasetFor Classification Workflow Executor Partitioning AutoML Scorer CSV Reader Number To String Statistics Solving a Classification Task with AutoML下記サイトより入手:https://hub.knime.com/knime/spaces/Examples/latest/09_Enterprise/04_Integrated_Deployment/03_AutoML_Deployment/02_AutoML_Regression_and_Classification_Examples~ifIPg5Pr0hCk62GS Just KNIME It! Season2課題19: 糖尿病との付き合い方レベル: 簡単もしくは中程度説明: このチャレンジでは、あなたは臨床医の役割を担い、機械学習が糖尿病の予測に役立つかどうかをチェックします。ベースラインの精度65%を上回り、両方のクラス(糖尿病である場合と糖尿病でない場合)で非常にうまく機能するソリューションを作成する必要があります。 我々は最小限のワークフローで77%の精度を得ました。もしこのチャレンジを簡単なものから中程度のものにしたいのであれば、下記を実装してみてください:sampling techniqueshttps://hub.knime.com/victor_palacios/spaces/Public/latest/Sampling%20Strategies%20Comparison~ouHL6-Ca44-UK-Wtfeature importance calculationhttps://www.knime.com/blog/understand-ml-model-global-feature-importance Input:0 : Model as a Workflow Object1 : Data from Model Test PartitionOutput:0 : Global Feature ImportancePredictTop : Train + Validation setsBottom : Test setexecute up-streambefore configurationdiabetes.csvOutcomeが判定対象なので文字列データへデータ観察疑問: 例えばBloodPressure = 0ってどういう場合なのだろうか?Global FeatureImportance Select Example DatasetFor Classification Workflow Executor Partitioning AutoML Scorer CSV Reader Number To String Statistics

Nodes

Extensions

Links