数据挖掘实验报告实验1Weka基础操作.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘实验报告实验1Weka基础操作.doc

学生实验报告 学 院:信息管理学院 课程名称:数据挖掘 教学班级: B01 姓 名: 学 号: 实验报告 课程名称 数据挖掘 教学班级 B01 指导老师 学号 姓名 行政班级 实验项S 实验一:Weka的基本操作 组员名单 独立完成 实验类型 ■操作性实验 □验证性实验 □综合性实验 实验地点 11535 实验口期 2016. 09.28 实验目的和要求: Explorer界面的各项功能; 注意不能与课件上的截图相同,可采用打开不同的数据文件以示区别。 Weka的两种数据表格编辑文件方式下的功能介绍; Explorer-Preprocess-edit,弹出 Viewer 对话框; Weka GUI 选择器窗口-Tools | ArffViewer,打开 ARFF-Viewer 窗口。 ARFF文件组成。 实验过程(记录实验步骤、分析实验结果) 2.1 Explorer界面的各项功能 2.1.1初始界面示意 ?罾eka GUI Chooser B回? Prop-am Yisualiration £ools U?lp Applications Explorer ?VEKA [ The University of Waikato Exp?riB?nltr Taxkato fAvircnx?nt for A.kItbxi Vcrsica S. 7.13 (e) 1999 - 2015 The Vnxvtrsxtr ci Taxkate Haxilton* K? Zealand Kn?vl?dc?Flow 其中:explorer选项是数据挖掘梳理数据S常用界面,也是使用weka S简中.的方法。 Experimenter:实验者选项,提供不同数值的比较,发现其屮规律。 KnowledgeFlow:知识流,其屮包含处理大型数裾的方法,初学者应用较少。 Simple CLI :命令行窗口,有点像cmd格式,非图形界而。 2.1.2进入Explorer界面功能介绍 (1)任务面板 Preprocess (数据预处理):选择和修改要处理的数据。 Classify (分类):训练和测试分类或回归模型。 Cluster (聚类):从数据屮聚类。聚类分析时用的较多。 Associate (关联分析):从数据中学习关联规则。 Select Attributes (选择属性):选择数据屮最相关的属性。 Visualize (可视化):查看数据的二维散布阁。 (2)常用按钮 Openfile:打开文件 Open URL:打开URL格式文件 Open DB:打开数据库文件 Generate:数据也成 Undo:撤销操作 Edit:编辑数据 Save:保存数据文件,可实现文件格式的转换,比如csv格式文件向A.RFF格式文件转换等等。 筛选数据 Choose:从这个按钮进去可以选择某个过滤器对数据进行筛选,数据预处理一般使用这个。 Apply:处理完成后,点击这个按钮,处理生效。 数据集的属性关系和操作 current relation:展示了属性的(relation)关系名称,(attributes)属性数,(Insetances)实例数,(sum of weights)权重的总和等多种属性关系。 AUributes:展示了属性的所有列,上边的四个按钮是对属性歹⑽快捷选择按钮,包括(all)全选,(none) 全不选,(Iverl)反选,(patern)模式;,选择符合某一条件的属性列。 最下边的remove按钮可以删除选中的属性列,如果想撤回,可以使用上边提到的undo按钮? 属性 和直方图 Selected attributes:如果是数值属性:属性名(Name)、属性类型(Type)、缺失值(Missing)个 数及百分比、不同值(Distinct)数、唯一值(Unique)数及百分比等等。 对于数伉属性和标称属性, 的方式是不一样的。阁屮显示的是标签的取值及相应取伉的实例数。 选中属性的直方图。若数据集的最后一个属性是类标变量(这是分类或回归任务的默认目标变量, 如“play”),直方图中的每个长方形就会按照该变量的比例分成不同颜色的段。 要想换个分段的依据,在上方的下拉框巾选个不同的分类属性就可以了。 下拉框里选上“No Class”或者一个数值属性会变成黑白的直方图。 Visualize:展示所有的属性的直方图 状态栏(status) 0*?裊 fal*filterdbo?霣relatiMiOres uvxI4at SaveKtl.tioaXBStMbCWt 1S00 Attrikste*AllAltrikvtet XFett?r?I tjrStatutic■ 0*?裊 fal* filter dbo?霣 relatiMi Ores uvx

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档