Icon

JKISeasor2-6_​tomljh_​ver1

Chinese Description 中文注释

挑战06:航空公司评论水平:难描述:您在一家营销机构工作,该机构监控几家航空公司的在线状态,以了解他们的审查方式。系统要求您确定提及航空公司的推文是正面、中立还是负面,并决定为此任务实现一个简单的情绪分析分类器。自动化此过程时,您可以获得什么准确性?分类器是否可能帮助公司审核人员节省时间?注意:考虑到数据集的大小,训练分类器可能需要一段时间才能在机器上执行(尤其是如果您使用更复杂的方法)。如果您想加快解决方案的速度,请在本次挑战中只使用数据集的一部分。提示1:查看我们的文本处理扩展 Text processing extension,了解更多关于如何将推文的单词转化为分类器可以探索的特征信息。提示2:如果您想更快地完成部分工作,请研究、使用和/或调整共享组件扩展和预处理Enrichment and Preprocessing以及文档矢量化Document Vectorization(按此顺序!)。他们是专门为迎接这一挑战而创建的。提示3:记住将数据集划分为训练集和测试集,以便创建决策树模型并对其进行评估。可以随意使用您喜欢的分区策略。 GBDT Model Decision Tree Model Node 1split training set from test datause decision tree to predict classesbuild decision treeNode 15Node 17Node 18Node 19Node 20 Table Reader Enrichment andPreprocessing DocumentVectorization Partitioning Decision TreePredictor DecisionTree Learner Scorer Decision Tree View Gradient BoostedTrees Learner Gradient BoostedTrees Predictor Scorer Joiner 挑战06:航空公司评论水平:难描述:您在一家营销机构工作,该机构监控几家航空公司的在线状态,以了解他们的审查方式。系统要求您确定提及航空公司的推文是正面、中立还是负面,并决定为此任务实现一个简单的情绪分析分类器。自动化此过程时,您可以获得什么准确性?分类器是否可能帮助公司审核人员节省时间?注意:考虑到数据集的大小,训练分类器可能需要一段时间才能在机器上执行(尤其是如果您使用更复杂的方法)。如果您想加快解决方案的速度,请在本次挑战中只使用数据集的一部分。提示1:查看我们的文本处理扩展 Text processing extension,了解更多关于如何将推文的单词转化为分类器可以探索的特征信息。提示2:如果您想更快地完成部分工作,请研究、使用和/或调整共享组件扩展和预处理Enrichment and Preprocessing以及文档矢量化Document Vectorization(按此顺序!)。他们是专门为迎接这一挑战而创建的。提示3:记住将数据集划分为训练集和测试集,以便创建决策树模型并对其进行评估。可以随意使用您喜欢的分区策略。 GBDT Model Decision Tree Model Node 1split training set from test datause decision tree to predict classesbuild decision treeNode 15Node 17Node 18Node 19Node 20Table Reader Enrichment andPreprocessing DocumentVectorization Partitioning Decision TreePredictor DecisionTree Learner Scorer Decision Tree View Gradient BoostedTrees Learner Gradient BoostedTrees Predictor Scorer Joiner

Nodes

Extensions

Links