网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘实验报告数据准备+关联规则挖掘+分类知识挖掘..docxVIP

数据挖掘实验报告数据准备+关联规则挖掘+分类知识挖掘..docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘实验报告数据准备关联规则挖掘分类知识挖掘.

数据挖掘实验报告班级学号姓名课程数据挖掘实验名称实验一:数据准备实验类型实验目的:(1)掌握利用文本编辑软件生成ARFF文件的方法;(2)掌握将EXCEL表格文件转换为ARFF文件的方法;(3)掌握数据的预处理方法。实验要求:(1)将下列表格中的数据利用文本编辑软件生成ARFF文件:姓名出生日期性别婚否工资职业信用等级黄大伟1970.05.08男3580教师优秀李明1964.11.03男是4850公务员优秀张明明1975.03.12女是职员优秀覃明勇1981.07.11男是2980职员良好黄燕玲1986.05.08女否2560工人一般表中没有填上的数据为缺失数据。请列出你编辑ARFF文件并在WEKA中打开该文件。(2)将EXCEL表格文件“bankdata.xls”转换为ARFF文件的方法,并将它另存为ARFF文件“bankdata.arff”, 在WEKA中打开该文件,写出操作过程。(3)数值属性的离散化:在WEKA中打开ARFF文件“bankdata.arff”,对属性“age”和“income”分别按等宽分箱和等深分箱进行离散化为三个箱。给出分箱的结果。实验结果:(1) @relation book1@attribute 姓名 {黄大伟,李明,张明明,覃明勇,黄燕玲}@attribute 出生日期 {1970.05.08,1964.11.03,1975.03.12,1981.07.11,1986.05.08}@attribute 性别 {男,女}@attribute 婚否 {是,否}@attribute 工资 numeric@data黄大伟,1970.05.08,男,?,3580李 ,1964.11.03,男,是,4850张明明,1975.03.12,女,是,?覃明勇,1981.07.11,男,是,2980黄燕玲,1986.05.08,女,否,2560(2)先把 bankdata.xls转化为CSV文件格式得到bankdata.csv,再在WEKA中打开,再另存为ARFF格式,就可以得到bankdata.arff。即由转换为,再转换得在WEKA中打开如下:(3)对age按等宽进行离散化分箱如下:对income进行等深离散化分箱如下:实验名称实验二:关联规则挖掘实验类型综合性实验实验目的:(1)掌握WEKA关联规则挖掘中的数据准备方法。(2)掌握WEKA关联规则挖掘中的参数设置方法。(3)掌握关联规则挖掘结果的分析。实验要求:(1)将下列事务数据库转换为二元表格形式(以项目作为属性,在某个事务中,该项目出现则取值为yes,不出现则取值为no。)并生成ARFF文件格式。CustomerCommoditiesC1milk,egg,bread,chipsC2egg,popcorn,chips,beerC3egg,bread,chipsC4milk,egg,bread,popcorn,chips,beerC5milk,bread,beerC6egg,bread,beerC7milk,bread,chipsC8milk,egg,bread,butter,chipsC9milk,egg,butter,chips(2)选择关联规则算法并设置相关参数。(3)运行算法,输出频繁项集及强关联规则。(4)从挖掘结果来看,你发现了什么有兴趣的规则?实验结果:(1)Customermilkeggbreadchipspopcornbeerbutterc1yesyesyesyesnononoc2noyesnoyesyesyesnoc3noyesyesyesnononoc4yesyesyesyesyesyesnoc5yesnoyesnonoyesnoc6noyesyesnonoyesnoc7yesnoyesyesnononoc8yesyesyesyesnonoyesc9yesyesnoyesnonoyes将文件保存为“yes-no.csv”,在WEKA中打开yes.csv文件,然后save为yes-no.arff即生成ARFF文件格式。(2) 打开数据文件:用“Explorer”打开“yes-no.arff”后,切换到“Associate”选项卡。选择算法:默认关联规则分析是用Apriori算法。点“Choose”按钮在弹出的窗口中可以选择关联规则算法。参数设置:单击“Choose”按钮右边的文本框会弹出参数设置对话框,可以修改默认的参数,弹出的窗口中点“More”可以看到各参数的说明。设置如下图:(3)运行算法单击“Start”按钮开始关联分析,输出频繁项集及强关联规则。(4)我发现本来在我们看来毫无联系的事物,经过分析发现它们有着密切联系。实验名称实验三:分类知识挖掘实验类型综合性实验实验目的:(1)掌握利用决策树(C4.5算法)进行分类的方法。(

文档评论(0)

vc5gv1x + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档