基于weka的数据分类分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于weka的数据分类分析基于weka的数据分类分析.doc

基于weka的数据分类分析 实验题目基于weka的数据分类分析小组合作否姓名班级12级信管班学 号一、实验目的使用数据挖掘中的分类算法,对数据集进行分类训练并测试; 应用不同的分类算法,比较他们之间的不同; 了解Weka平台的基本功能与使用方法。二.实验环境1、win7+eclipse+weak; 2、实验室网络环境实验内容与步骤(一)数据准备及预处理 格式转换方式; (二)三种分类方法分析 1、决策树分类; 2、K最近邻算法分类; 3、朴素贝叶斯分类; 4、三类分类方法的校验结果比较;四、实验过程与分析数据准备及预处理 格式转换方式; 原始数据是excel文件保存的xlsx格式数据,需要转换成Weka支持的arff文件格式或csv文件格式。由于Weka对arff格式的支持更好,这里我们选择arff格式作为分类器原始数据的保存格式。 转换方法:在excel中打开“weather.xlsx”,选择菜单文件-另存为,在弹出的对话框中,文件名输入“weather”,保存类型选择“CSV(逗号分隔)”,保存,我们便可得到“weather.csv”文件;然后,打开Weka的Exporler,点击Open file按钮,打开刚才得到的“weather”文件,点击“save”按钮,在弹出的对话框中,文件名输入“weather”,文件类型选择“Arff data files(*.arff)”,这样得到的数据文件为“weather.arff”。 (二)三种分类方法分析 决策树分类: 用“Explorer”打开刚才得到的“train-data.arff”,并切换到“Class”。点“Choose”按钮选择“tree (weka.classifiers.trees.j48)”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: K最近邻算法分类: 点“Choose”按钮选择“laze-ibk”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: 朴素贝叶斯分类; 点“Choose”按钮选择“bayes”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: 三类分类方法的校验结果比较; 据上述数据,虽然朴素贝叶斯分类算法有最高的准确率, 而标准误差较高;而决策树的准确率相对较???而标准误差也较高,综合评价可以得知,当前最好的分类算法是KNN算法。五、实验总结通过本次实验,使我对Weka平台有了比较完整和深入的认识,对Weka中进行分类分析的KNN算法、素贝叶斯算法和决策树算法都有了进一步的理解。通过实验,对数据挖掘本身也有了比较直观的认识,同时也深刻体会到数据预处理对于数据挖掘的重要性。

文档评论(0)

ganqludp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档