数据挖掘实验指南part.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘实验指南本ppt主要为08届信科胡旭灵根据实验课内容制作,10届统计旷英兰参与部分修改,特表感谢!2025/4/181数据挖掘实验指南

本ppt使用说明2025/4/182数据挖掘实验指南标为红色字体为课程涉及的主要操作此ppt主要为方便大家熟悉weka的基本使用,如果要深入学习,可参考其他书籍,欢迎和大家一起共同学习进步。软件中提到的软件自带数据,是指在软件安装文件夹中有个data的文件夹里面的数据。020103

总体框架2025/4/183数据挖掘实验指南

Weka软件2025/4/184Weka软件是著名的免费数据挖掘软件,各位同学可到官方网站下载共有两种类型,一种以jre结尾,表示软件自带java虚拟机,另一种不带(适合pc上已安装java虚拟机)。数据挖掘实验指南

安装运行weka2025/4/185下载安装包后,解压安装。注:安装后若发现运行软件出现一闪而过,则说明java环境变量没设置好(鉴于大家都学过java,设环境变量的步骤是大家应该会的)。01数据挖掘实验指南02

设置java环境变量后运行2025/4/186数据挖掘实验指南

Weka功能简介2025/4/1871Weka介绍2菜单栏里program里有个重要的logwindow—日志窗口选项卡,用来显示包括出错信息等。3Visualization是进行数据可视化操作4Tools是与查看文件有关的功能5数据挖掘实验指南

四大主要应用程序2025/4/188数据挖掘实验指南Explorer是探索数据的环境,在本课程中将主要介绍。01Experimenter是用来运行算法试验,算法检验等的环境。02Knowledgefolw这个环境与explorer相似,但支持拖放。03simpleCLI是命令行界面,可以直接执行weka命令,其实在cmd命令窗里也可直接运行weka的命令,前提是设好环境变量等。04

读取数据2025/4/189数据挖掘实验指南举例:Explorer》openfile(选择本机安装文件夹里自带的数据)》选择weather.arff

(注:.arff文件是weka识别的主要类型,weka还识别spss的.cvs类型的数据,故数据转换为普通数据-spss.csv-.arff,也可以用写字板和记事本打开arff文件以观察数据)数据挖掘实验指南

Explorer的process界面简介2025/4/1811点击edit可修改数据选择属性后点击remove可删除属性可进行数据的变换如离散化的数据预处理数据预处理的主要选项数据挖掘实验指南

数据预处理2025/4/18数据挖掘实验指南12数据预处理作为数据挖掘的前奏,起着奠基石的作用,希望引起各位同学的重视。

数据预处理举例:离散化2025/4/1813打开C:\ProgramFiles\Weka-3-6\data\weather.arff后点击choose点击数据挖掘实验指南

选择choose后选择过滤规则:离散化2025/4/1814Choose-filters-unsupervised-attribute-discretizediscretize数据挖掘实验指南

选择规则后,应用规则进行离散化2025/4/181501双击所选规则可进行规则的参数设置,见右框02此框可调整参数03点击apply则应用规则04进行选择要离散化的属性05数据挖掘实验指南

离散化后的结果2025/4/1816应用规则后,离散化分为10类,如下图所示应用规则后再点击该属性可视化数据挖掘实验指数据预处理总结数据预处理的方式非常多,但基本流程跟离散化差不多,请各位同学自行尝试,多实践。2025/4/1817数据挖掘实验指南

文档评论(0)

gongmengjiao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档