- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘实验报告实验1Weka基础操作.doc
学生实验报告
学 院:信息管理学院
课程名称:数据挖掘
教学班级: B01
姓 名:
学 号:
实验报告
课程名称
数据挖掘 教学班级 B01
指导老师
学号 姓名
行政班级
实验项S
实验一:Weka的基本操作
组员名单
独立完成
实验类型
■操作性实验 □验证性实验 □综合性实验
实验地点
11535
实验口期
2016. 09.28
实验目的和要求:
Explorer界面的各项功能;
注意不能与课件上的截图相同,可采用打开不同的数据文件以示区别。
Weka的两种数据表格编辑文件方式下的功能介绍;
Explorer-Preprocess-edit,弹出 Viewer 对话框;
Weka GUI 选择器窗口-Tools | ArffViewer,打开 ARFF-Viewer 窗口。
ARFF文件组成。
实验过程(记录实验步骤、分析实验结果)
2.1 Explorer界面的各项功能
2.1.1初始界面示意
?罾eka GUI Chooser
B回?
Prop-am Yisualiration £ools U?lp
Applications
Explorer
?VEKA [
The University of Waikato
Exp?riB?nltr
Taxkato fAvircnx?nt for A.kItbxi
Vcrsica S. 7.13
(e) 1999 - 2015
The Vnxvtrsxtr ci Taxkate
Haxilton* K? Zealand
Kn?vl?dc?Flow
其中:explorer选项是数据挖掘梳理数据S常用界面,也是使用weka S简中.的方法。 Experimenter:实验者选项,提供不同数值的比较,发现其屮规律。 KnowledgeFlow:知识流,其屮包含处理大型数裾的方法,初学者应用较少。
Simple CLI :命令行窗口,有点像cmd格式,非图形界而。 2.1.2进入Explorer界面功能介绍
(1)任务面板
Preprocess (数据预处理):选择和修改要处理的数据。 Classify (分类):训练和测试分类或回归模型。
Cluster (聚类):从数据屮聚类。聚类分析时用的较多。
Associate (关联分析):从数据中学习关联规则。
Select Attributes (选择属性):选择数据屮最相关的属性。
Visualize (可视化):查看数据的二维散布阁。
(2)常用按钮
Openfile:打开文件
Open URL:打开URL格式文件
Open DB:打开数据库文件
Generate:数据也成 Undo:撤销操作 Edit:编辑数据
Save:保存数据文件,可实现文件格式的转换,比如csv格式文件向A.RFF格式文件转换等等。
筛选数据
Choose:从这个按钮进去可以选择某个过滤器对数据进行筛选,数据预处理一般使用这个。 Apply:处理完成后,点击这个按钮,处理生效。
数据集的属性关系和操作
current relation:展示了属性的(relation)关系名称,(attributes)属性数,(Insetances)实例数,(sum of weights)权重的总和等多种属性关系。
AUributes:展示了属性的所有列,上边的四个按钮是对属性歹⑽快捷选择按钮,包括(all)全选,(none) 全不选,(Iverl)反选,(patern)模式;,选择符合某一条件的属性列。
最下边的remove按钮可以删除选中的属性列,如果想撤回,可以使用上边提到的undo按钮?
属性 和直方图
Selected attributes:如果是数值属性:属性名(Name)、属性类型(Type)、缺失值(Missing)个 数及百分比、不同值(Distinct)数、唯一值(Unique)数及百分比等等。
对于数伉属性和标称属性, 的方式是不一样的。阁屮显示的是标签的取值及相应取伉的实例数。 选中属性的直方图。若数据集的最后一个属性是类标变量(这是分类或回归任务的默认目标变量,
如“play”),直方图中的每个长方形就会按照该变量的比例分成不同颜色的段。
要想换个分段的依据,在上方的下拉框巾选个不同的分类属性就可以了。
下拉框里选上“No Class”或者一个数值属性会变成黑白的直方图。
Visualize:展示所有的属性的直方图
状态栏(status)
0*?裊 fal*filterdbo?霣relatiMiOres uvxI4at SaveKtl.tioaXBStMbCWt 1S00 Attrikste*AllAltrikvtet XFett?r?I tjrStatutic■
0*?裊 fal*
filter
dbo?霣
relatiMi
Ores uvx
文档评论(0)