数据挖掘实验报告-实验1-Weka基础操作.docx

数据挖掘实验报告-实验1-Weka基础操作.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘实验报告-实验1-Weka基础操作

学生实验报告学 院:信息管理学院课程名称: 数据挖掘 教学班级: B01 姓 名: 学 号: 实 验 报 告课程名称数据挖掘教学班级B01指导老师学号姓名行政班级实验项目实验一: Weka的基本操作组员名单独立完成实验类型■操作性实验 □验证性实验 □综合性实验实验地点H535实验日期2016.09.281. 实验目的和要求:(1)Explorer界面的各项功能;注意不能与课件上的截图相同,可采用打开不同的数据文件以示区别。(2)Weka的两种数据表格编辑文件方式下的功能介绍;①Explorer-Preprocess-edit,弹出Viewer对话框;②Weka GUI选择器窗口-Tools | ArffViewer,打开ARFF-Viewer窗口。(3)ARFF文件组成。2.实验过程(记录实验步骤、分析实验结果)2.1 Explorer界面的各项功能2.1.1 初始界面示意其中:explorer选项是数据挖掘梳理数据最常用界面,也是使用weka最简单的方法。Experimenter:实验者选项,提供不同数值的比较,发现其中规律。KnowledgeFlow:知识流,其中包含处理大型数据的方法,初学者应用较少。Simple CLI :命令行窗口,有点像cmd 格式,非图形界面。2.1.2 进入Explorer 界面功能介绍(1)任务面板Preprocess(数据预处理):选择和修改要处理的数据。 Classify(分类):训练和测试分类或回归模型。 Cluster(聚类):从数据中聚类。 聚类分析时用的较多。Associate(关联分析):从数据中学习关联规则。 Select Attributes(选择属性):选择数据中最相关的属性。 Visualize(可视化) :查看数据的二维散布图。 (2)常用按钮Openfile:打开文件Open URL:打开URL格式文件Open DB:打开数据库文件Generate:数据生成Undo:撤销操作Edit:编辑数据Save:保存数据文件,可实现文件格式的转换,比如csv 格式文件向ARFF格式文件转换等等。(3)筛选数据Choose:从这个按钮进去可以选择某个过滤器对数据进行筛选,数据预处理一般使用这个。Apply:处理完成后,点击这个按钮,处理生效。(4)数据集的属性关系和操作current relation:展示了属性的(relation)关系名称,(attributes)属性数,(Insetances)实例数,(sum of weights)权重的总和等多种属性关系。Attributes:展示了属性的所有列,上边的四个按钮是对属性列的快捷选择按钮,包括(all)全选,(none)全不选,(Ivert)反选,(patern)模式,选择符合某一条件的属性列。最下边的remove 按钮可以删除选中的属性列,如果想撤回,可以使用上边提到的undo 按钮~(5)属性摘要和直方图Selected attributes:如果是数值属性:属性名(Name)、属性类型(Type)、缺失值(Missing)个数及百分比、不同值(Distinct)数、唯一值(Unique)数及百分比等等。对于数值属性和标称属性,摘要的方式是不一样的。图中显示的是标签的取值及相应取值的实例数。 选中属性的直方图。若数据集的最后一个属性是类标变量(这是分类或回归任务的默认目标变量,如“play” ),直方图中的每个长方形就会按照该变量的比例分成不同颜色的段。 要想换个分段的依据,在上方的下拉框中选个不同的分类属性就可以了。下拉框里选上“No Class”或者一个数值属性会变成黑白的直方图。Visualize:展示所有的属性的直方图(6)状态栏(status)显示一些信息让你知道正在做什么。在状态栏中的任意位置右击鼠标将会出现一个小菜单。有两个选项: Memory Information--显示WEKA可用的内存量。 Run garbage collector--强制运行Java垃圾回收器,搜索不再需要的内存空间并将之释放,从而可为新任务分配更多的内存。Log:按钮可以查看以weka操作日志 。没有任务时,右边的小鸟是坐着的,任务运行时,小鸟会站起来左右摇摆。若小鸟站着但不转动,表示任务出了问题。2.1.2 引例操作显示功能(1)2.2 weka 的两种数据表格编辑方式下的功能介绍①Explorer-Preprocess-edit,弹出Viewer对话框;双击鼠标可以对数据进行修改,在数据上使用右键可以对数据修改进行撤回(undo)对数据修改之后,如果想保存,点击下方的ok,撤回点击undo,不保存直接点击cancel②Weka GUI选择器窗口-Tools | Arf

文档评论(0)

dsf80fhg0j + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档