Icon

Titanic_​survivor_​prediction

Kaggleの
Titanic - Machine Learning from Disaster
https://www.kaggle.com/competitions/titanic/overview
を題材に、交差検証を用いながらハイパーパラメータ探索を行って予測結果を出力するワークフローのサンプル。

データ前処理(欠損値補完) データ前処理(新規列追加) データ前処理(データの整形やtrain/test分割) ハイパーパラメーター探索 with 交差検証 ハイパーパラメーター調整済みモデルでの予測結果出力 titanic_train.csv の読み込みtitanic_test.csv の読み込み欠損値補完Fare/Embarked欠損値確認Cabin を0/1に変換欠損値確認勾配ブースティング決定木学習器FamilySize列追加train/test結合HonorificTitle列追加(1/4)HonorificTitle列追加(2/4)HonorificTitle列追加(3/4)HonorificTitle列追加(4/4)敬称別の年齢中央値確認年齢の欠損値を敬称別の中央値で補完相関係数確認TicketIni列追加TicketLen列追加train/test分割カテゴリ変数を数値化目的変数を一番目にソート勾配ブースティング決定木予測器testデータtrainデータ説明変数をカテゴリ化Stratified K Fold Cross Validation開始Stratified K Fold Cross Validation終了ハイパーパラメーター最適化ループ開始スコア評価ハイパーパラメーター最適化ループ終了Best Parametersハイパーパラメーター調整済み勾配ブースティング決定木学習器ハイパーパラメーター調整済み勾配ブースティング決定木予測器提出ファイル作成PassengerIdSurvived CSV Reader CSV Reader Missing Value Extract MissingValue Cause Rule Engine Extract MissingValue Cause Gradient BoostedTrees Learner Math Formula Concatenate Cell Splitter Cell Splitter Column Filter Column Rename GroupBy Rule Engine Linear Correlation String Manipulation String Manipulation Row Splitter Category To Number Column Resorter Gradient BoostedTrees Predictor Column Filter Column Filter Number To String X-Partitioner X-Aggregator Parameter OptimizationLoop Start Scorer ParameterOptimization Loop End Table Rowto Variable Gradient BoostedTrees Learner Gradient BoostedTrees Predictor CSV Writer Column Filter データ前処理(欠損値補完) データ前処理(新規列追加) データ前処理(データの整形やtrain/test分割) ハイパーパラメーター探索 with 交差検証 ハイパーパラメーター調整済みモデルでの予測結果出力 titanic_train.csv の読み込みtitanic_test.csv の読み込み欠損値補完Fare/Embarked欠損値確認Cabin を0/1に変換欠損値確認勾配ブースティング決定木学習器FamilySize列追加train/test結合HonorificTitle列追加(1/4)HonorificTitle列追加(2/4)HonorificTitle列追加(3/4)HonorificTitle列追加(4/4)敬称別の年齢中央値確認年齢の欠損値を敬称別の中央値で補完相関係数確認TicketIni列追加TicketLen列追加train/test分割カテゴリ変数を数値化目的変数を一番目にソート勾配ブースティング決定木予測器testデータtrainデータ説明変数をカテゴリ化Stratified K Fold Cross Validation開始Stratified K Fold Cross Validation終了ハイパーパラメーター最適化ループ開始スコア評価ハイパーパラメーター最適化ループ終了Best Parametersハイパーパラメーター調整済み勾配ブースティング決定木学習器ハイパーパラメーター調整済み勾配ブースティング決定木予測器提出ファイル作成PassengerIdSurvived CSV Reader CSV Reader Missing Value Extract MissingValue Cause Rule Engine Extract MissingValue Cause Gradient BoostedTrees Learner Math Formula Concatenate Cell Splitter Cell Splitter Column Filter Column Rename GroupBy Rule Engine Linear Correlation String Manipulation String Manipulation Row Splitter Category To Number Column Resorter Gradient BoostedTrees Predictor Column Filter Column Filter Number To String X-Partitioner X-Aggregator Parameter OptimizationLoop Start Scorer ParameterOptimization Loop End Table Rowto Variable Gradient BoostedTrees Learner Gradient BoostedTrees Predictor CSV Writer Column Filter

Nodes

Extensions

Links