- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
weka_intro_v.ppt
分类例子 结果 3.7聚类 3.7.1 选择聚类器(Clusterer) 现在我们应该熟悉选择和配置对象的过程了。点击列在窗口顶部的 Clusterer 栏中的聚类算法,将弹出一个用来选择新聚类算法的 GenericObjectEditor 对话框。 3.7.2 聚类模式 Cluster Mode 一栏用来决定依据什么来聚类以及如何评价聚类的结果。前三个选项和分类的情形是一样的:Use training set、 Supplied test set 和 Percentage split——区别在于现在的数据是要聚集到某个类中,而不是预测为某个指定的类别。第四个模式,Classes to clusters evaluation,是要比较所得到的聚类与在数据中预先给出的类别吻合得怎样。和 Classify 面板一样,下方的下拉框是用来选择作为类别的属性的。 在 Cluster mode 之外,有一个 Store clusters for visualization 的勾选框,该框决定了在训练完算法后可否对数据进行可视化。对于非常大的数据集,内存可能成为瓶颈时,不勾选这一栏应该会有所帮助。 3.7.3 忽略属性 在对一个数据集聚类时,经常遇到某些属性应该被忽略的情况。Ignore attributes 可以弹出一个小窗口,选择哪些是需要忽略的属性。 3.7.4 学习聚类 Cluster 面板就像Classify面板那样,有一个 Start/Stop 按钮,一个结果文本的区域和一个结果列表。它们的用法都和分类时的一样。右键点击结果列表中的一个条目将弹出一个相似的菜单,只是它仅显示两个可视化选项:Visualize cluster assignments 和 Visualize tree。后者在它不可用时会变灰。 聚类例子 高速公路事故数据集(AccidentData) 7个属性(相关车辆数、相关人数、相关行人数、事发地车道数、事发地最高限度、死亡人数、酒驾司机数) 1741个样本 聚类例子 导入csv格式数据 点击聚类按钮 选择聚类器 聚类例子 开始聚类 聚类结果 3.8关联规则 3.8.1 设定 这个面板包含了学习关联规则的方案。这里的学习器也可以跟其它面板的聚类器,筛选器和分类器一样选择和配置。 3.8.2 学习关联规则 为关联规则学习器设置好合适的参数后,点击 Start 按钮。完成后右键点击结果列表中的条目可以查看或保存结果。 3.9属性选择 3.9.1 搜索与评估 属性选择是说搜索数据集中全部属性的所有可能组合,找出预测效果最好的那一组属性。为实现这一目标,必须设定两个东西:属性评估器(evaluator)和搜索策略。评估器决定了怎样给一组属性安排一个表示它们好坏的值。搜索策略决定了要怎样进行搜索。 3.9.2 选项 Attribute Selection Mode 一栏有两个选项。 1. Use full training set. 使用训练数据的全体好决定一组属性的好坏。 2. Cross-validation. 一组属性的好坏通过一个交叉验证过程来决定。Fold 和 Seed 分别给出了交叉验证的折数和打乱数据时的随机种子。 和 Classify 部分(4.1节)一样,有一个下拉框来指定 class 属性。 3.9.3 执行选择 点击 Start 按钮开始执行属性选择过程。它完成后,结果会输出到结果区域中,同时结果列表中会增加一个条目。在结果列表上右击,会给出若干选项。其中前面三个(View in main window,View in separate window 和 Save result buffe)和分类面板中是一样的。还可以可视化精简过的数据集(Visualize reduced data),或者,如果使用过主成分分析那样的属性变换工具,则能可视化变换过的数据集(Visualize transformed data)。精简过/变换过的数据能够通过 Save reduced data... 或 Save transformed data... 选项来保存。 3.10 可视化 WEKA 的可视化页面可以对当前的关系作二维散点图式的可视化浏览。 3.10.1 散点图矩阵 选择了 Visualize 面
您可能关注的文档
最近下载
- 专题2.5 不等式中含参问题【十大题型】(举一反三)(北师大版)(解析版).docx VIP
- 保洁培训方案.docx VIP
- 专题9.5 不等式中含参问题【十大题型】(举一反三)(人教版)(解析版).pdf VIP
- 2025年3月四川凉山州西昌市人民医院招聘临床护士43人笔试备考题库及答案解析.docx
- 经颅超声的黑质高回声强度定量化分析方法.pdf VIP
- 2024中央财经大学人才招聘39人(非教学科研岗)考试备考题库及答案解析.docx VIP
- 2024中央财经大学人才招聘39人(非教学科研岗)笔试模拟试题及答案解析.docx VIP
- 2024完整解读英语课程新课标《义务教育英语课程标准(2024年版)》动态PPT内容课件.pptx VIP
- 中东第二课时复习课件七年级地理下学期人教版.pptx
- 人工湿地常用植物名录.docx
文档评论(0)