Icon

外れ値検出の4つの手法

外れ値検出の4つの手法

外れ値検出の4つの手法

航空会社データのサンプルを使用して、その空港における平均到着遅延に基づいて外れ値の空港を検出します。適用する技術は、数値的外れ値、z-score、DBSCAN、アイソレーションフォレストです。これらの手法で検出された外れ値は、KNIME OSM integrationを用いて米国の地図上に可視化されます。

データの読込み データの前処理 外れ値の検出-四分位範囲(IQR) 外れ値の可視化 外れ値検出の4つの手法四分位範囲(IQR)、z検定、DBSCANおよびアイソレーションフォレストの4つの手法で外れ値を検出しますこれらの各手法で検出された外れ値は、KNIME OSM統合を使用して米国の地図上に可視化します。要件:このワークフローを実行するには以下の機能が必要となります。- R の「sm」パッケージ ・・・ 「R Source(Workspace)」ノードでインストールすることが出来ます。 外れ値の検出-Z検定 外れ値の検出- DBSCAN 外れ値の検出- アイソレーションフォレスト 外れ値の可視化外れ値を検出到着空港ごとにグループ化航空会社のデータを読込みクラスタリング距離関数最小数の近傍変数名「new variable」四分位範囲(IQR)のスケーリング変数名「k」イプシロン近傍変数名「new variable」外れ値と非外れ値に分類外れ値を検出平均遅延の密度の正規化と描画アイソレーションフォレスト実行するには使用するパッケージをインストールする必要があります外れ値の閾値変数名「z」外れ値と非外れ値に分類外れ値と非外れ値に分類外れ値と非外れ値に分類外れ値の可視化外れ値の可視化外れ値の可視化フロー変数をマージ MapViz Numeric Outliers Preproc Read data DBSCAN Numeric Distances Integer Input Double Input Double Input Mark outliers Row Filter Density of delay Python Script (1⇒1)(deprecated) Double Input Mark outliers Mark outliers Mark outliers MapViz MapViz MapViz Merge Variables データの読込み データの前処理 外れ値の検出-四分位範囲(IQR) 外れ値の可視化 外れ値検出の4つの手法四分位範囲(IQR)、z検定、DBSCANおよびアイソレーションフォレストの4つの手法で外れ値を検出しますこれらの各手法で検出された外れ値は、KNIME OSM統合を使用して米国の地図上に可視化します。要件:このワークフローを実行するには以下の機能が必要となります。- R の「sm」パッケージ ・・・ 「R Source(Workspace)」ノードでインストールすることが出来ます。 外れ値の検出-Z検定 外れ値の検出- DBSCAN 外れ値の検出- アイソレーションフォレスト 外れ値の可視化外れ値を検出到着空港ごとにグループ化航空会社のデータを読込みクラスタリング距離関数最小数の近傍変数名「new variable」四分位範囲(IQR)のスケーリング変数名「k」イプシロン近傍変数名「new variable」外れ値と非外れ値に分類外れ値を検出平均遅延の密度の正規化と描画アイソレーションフォレスト実行するには使用するパッケージをインストールする必要があります外れ値の閾値変数名「z」外れ値と非外れ値に分類外れ値と非外れ値に分類外れ値と非外れ値に分類外れ値の可視化外れ値の可視化外れ値の可視化フロー変数をマージ MapViz Numeric Outliers Preproc Read data DBSCAN Numeric Distances Integer Input Double Input Double Input Mark outliers Row Filter Density of delay Python Script (1⇒1)(deprecated) Double Input Mark outliers Mark outliers Mark outliers MapViz MapViz MapViz Merge Variables

Nodes

Extensions

Links