Icon

JKI_​009_​Simple_​Anonymization

JKI_009_Simple_Anonymization
失敗例: 列間の関係が保持されたシャッフルとなってしまっている 課題9:簡単な匿名化レベル:中説明 KNIMEフォーラムに質問を投稿したいが、共有できない機密データを持っています。この課題では、データの機密事項(場所、名前、性別など)を明らかにする列を削除する(または変換する)ワークフローを作成します。その後、残りの列の行をシャッフルして、各数値列が元の統計的分布を維持しながら、他の列と関係を持たないようにする必要があります。これらの列も同様に、ワークフローの最後には特定の意味を持たないような名前に変更します。例を見てみましょう。Before anonymization Row Name Fav_Num Muscle_Mass 0 Victor 7 10 1 Aline 3 20 2 Scott 42 30 After anonymization Row column column (#1) 0 3 30 1 42 10 2 7 20データセット:https://hub.knime.com/alinebessa/spaces/Just%20KNIME%20It!%20Datasets/latest/Challenge%209%20-%20Dataset~lMS5apR4uXAPlfzb/ fifa.csvID, 人名, 国籍、所属を特定しうる情報は外す個人の識別につながりやすいデータの値の種別に数え上げデータ分布の概要を俯瞰データ重複数が少なすぎないか確認カラム別処理ループ完了後集計行間の関係がなくなるようにランダムシードも毎回変えて行ごとにシャッフルするカラム名の秘匿化シャッフル毎にRowIDをつけなおすこの処理がないとLoopEnd時にもとのRowID通りに各行のデータが揃えられてしまうカラム別処理行間の関係がなくなるようにランダムシードも毎回変えて行ごとにシャッフルするカラム名の秘匿化 ループ完了後集計もとのRowIDをキーにデータ結合されている CSV Reader Column Splitter Value Counter Statistics Value Counter Column ListLoop Start Loop End (ColumnAppend) Shuffle Column Rename RowID Column ListLoop Start Shuffle Column Rename Loop End (ColumnAppend) 失敗例: 列間の関係が保持されたシャッフルとなってしまっている 課題9:簡単な匿名化レベル:中説明 KNIMEフォーラムに質問を投稿したいが、共有できない機密データを持っています。この課題では、データの機密事項(場所、名前、性別など)を明らかにする列を削除する(または変換する)ワークフローを作成します。その後、残りの列の行をシャッフルして、各数値列が元の統計的分布を維持しながら、他の列と関係を持たないようにする必要があります。これらの列も同様に、ワークフローの最後には特定の意味を持たないような名前に変更します。例を見てみましょう。Before anonymization Row Name Fav_Num Muscle_Mass 0 Victor 7 10 1 Aline 3 20 2 Scott 42 30 After anonymization Row column column (#1) 0 3 30 1 42 10 2 7 20データセット:https://hub.knime.com/alinebessa/spaces/Just%20KNIME%20It!%20Datasets/latest/Challenge%209%20-%20Dataset~lMS5apR4uXAPlfzb/ fifa.csvID, 人名, 国籍、所属を特定しうる情報は外す個人の識別につながりやすいデータの値の種別に数え上げデータ分布の概要を俯瞰データ重複数が少なすぎないか確認カラム別処理ループ完了後集計行間の関係がなくなるようにランダムシードも毎回変えて行ごとにシャッフルするカラム名の秘匿化シャッフル毎にRowIDをつけなおすこの処理がないとLoopEnd時にもとのRowID通りに各行のデータが揃えられてしまうカラム別処理行間の関係がなくなるようにランダムシードも毎回変えて行ごとにシャッフルするカラム名の秘匿化 ループ完了後集計もとのRowIDをキーにデータ結合されている CSV Reader Column Splitter Value Counter Statistics Value Counter Column ListLoop Start Loop End (ColumnAppend) Shuffle Column Rename RowID Column ListLoop Start Shuffle Column Rename Loop End (ColumnAppend)

Nodes

Extensions

Links