

Just Knime It season2-20@obito_od

Just KNIME It! Season2
Challenge 20: Topics in Hotel Reviews

Just KNIME It! season2-20 Knime ver. : 4.7.6 方針posi-negaの確認はratingでできるので、感情分析はせずにWFを組む。verified componentsのTopic Extractor系がPCスペックの関係で動かないのでhttps://hub.knime.com/knime/spaces/Machine%20Learning%20and%20Marketing/latest/Consumer%20Mindset%20Metrics/CX%20and%20Topic%20Models/Topic%20Models%20from%20reviews~zXa_WBQgRZz4nqq6を流用して組むようにする。なお、タグクラウドはぱっと見でわかりやすい気分にはなるんだけども実際にはそこまで情報密度をあげられないので作るのは1つのみとし、実際にはキーワードセットを提示するに留める。 説明あなたは旅行会社に勤めており、オンライン上でホテルがどのようにレビューされているかを理解したいと考えています。レビュー全体ではどのようなトピックが一般的で、各トピックではどのような用語が最も関連しているのでしょうか?レビューを評価ごとに分けた場合はどうでしょうか?同僚がすでにあなたのためにレビューをクロールし、前処理をしてくれているので、あなたの仕事はレビューの関連するトピックを特定し、そのキーワードを探ることです。レビューから何が見つかるでしょうか?ヒント:トピック抽出はこの課題に取り組む際に非常に役立ちます。ヒント2: Coherenceとperplexityは、意味のある数のトピックを選ぶのに役立つメトリクスです。 Description: You work for a travel agency and want to better understand how hotels are reviewed online. What topics arecommon in the reviews as a whole, and what terms are most relevant in each topic? How about when you separate thereviews per rating? A colleague has already crawled and preprocessed the reviews for you, so your job now is to identifyrelevant topics in the reviews, and explore their key terms. What do the reviews uncover? Hint: Topic Extraction can be veryhelpful in tackling this challenge. Hint 2: Coherence and perplexity are metrics that can help you pick a meaningful number oftopics. step1:line plot を元にしてkを決定する(変化が鈍化しているkでなるべく小さい値にする) result1:whole review データ読み込み元データは容量の都合上dataエリアには置いていませんStep 2: Select a topictopic をリストにまとめbi-grams(tri-grams canbe added as well) Narrow down the searchon a smaller range from step 1.Identify elbow point (15)K=8 を選択することで先に進みます。色付色適用joinvariable化Step 2: Select a topictopic をリストにまとめ色適用色付rating=1variableをまとめるrating= 2色付色適用topic をリストにまとめStep 2: Select a topicrating= 3Step 2: Select a topictopic をリストにまとめ色適用色付rating= 4Step 2: Select a topictopic をリストにまとめ色適用色付rating= 5Step 2: Select a topictopic をリストにまとめ色適用色付Table Reader Topic Extractor(Parallel LDA) GroupBy N-grams Filter Reviews withLess than 10 words Step 2: Optimalk in [1,10] VisualizePerplexity Color Manager Color Appender Joiner Table Rowto Variable Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager Row Filter Breakpoint Row Filter Color Manager Color Appender GroupBy Topic Extractor(Parallel LDA) Row Filter Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager Row Filter Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager Row Filter Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager まとめ Just KNIME It! season2-20 Knime ver. : 4.7.6 方針posi-negaの確認はratingでできるので、感情分析はせずにWFを組む。verified componentsのTopic Extractor系がPCスペックの関係で動かないのでhttps://hub.knime.com/knime/spaces/Machine%20Learning%20and%20Marketing/latest/Consumer%20Mindset%20Metrics/CX%20and%20Topic%20Models/Topic%20Models%20from%20reviews~zXa_WBQgRZz4nqq6を流用して組むようにする。なお、タグクラウドはぱっと見でわかりやすい気分にはなるんだけども実際にはそこまで情報密度をあげられないので作るのは1つのみとし、実際にはキーワードセットを提示するに留める。 説明あなたは旅行会社に勤めており、オンライン上でホテルがどのようにレビューされているかを理解したいと考えています。レビュー全体ではどのようなトピックが一般的で、各トピックではどのような用語が最も関連しているのでしょうか?レビューを評価ごとに分けた場合はどうでしょうか?同僚がすでにあなたのためにレビューをクロールし、前処理をしてくれているので、あなたの仕事はレビューの関連するトピックを特定し、そのキーワードを探ることです。レビューから何が見つかるでしょうか?ヒント:トピック抽出はこの課題に取り組む際に非常に役立ちます。ヒント2: Coherenceとperplexityは、意味のある数のトピックを選ぶのに役立つメトリクスです。 Description: You work for a travel agency and want to better understand how hotels are reviewed online. What topics arecommon in the reviews as a whole, and what terms are most relevant in each topic? How about when you separate thereviews per rating? A colleague has already crawled and preprocessed the reviews for you, so your job now is to identifyrelevant topics in the reviews, and explore their key terms. What do the reviews uncover? Hint: Topic Extraction can be veryhelpful in tackling this challenge. Hint 2: Coherence and perplexity are metrics that can help you pick a meaningful number oftopics. step1:line plot を元にしてkを決定する(変化が鈍化しているkでなるべく小さい値にする) result1:whole review データ読み込み元データは容量の都合上dataエリアには置いていませんStep 2: Select a topictopic をリストにまとめbi-grams(tri-grams canbe added as well)Narrow down the searchon a smaller range from step 1.Identify elbow point (15)K=8 を選択することで先に進みます。色付色適用joinvariable化Step 2: Select a topictopic をリストにまとめ色適用色付rating=1variableをまとめるrating= 2色付色適用topic をリストにまとめStep 2: Select a topicrating= 3Step 2: Select a topictopic をリストにまとめ色適用色付rating= 4Step 2: Select a topictopic をリストにまとめ色適用色付rating= 5Step 2: Select a topictopic をリストにまとめ色適用色付Table Reader Topic Extractor(Parallel LDA) GroupBy N-grams Filter Reviews withLess than 10 words Step 2: Optimalk in [1,10] VisualizePerplexity Color Manager Color Appender Joiner Table Rowto Variable Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager Row Filter Breakpoint Row Filter Color Manager Color Appender GroupBy Topic Extractor(Parallel LDA) Row Filter Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager Row Filter Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager Row Filter Topic Extractor(Parallel LDA) GroupBy Color Appender Color Manager まとめ


