- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于weka的数据分类分析实验报告
1实验基本内容
本实验的基本内容是通过使用weka中的三种常见分类和聚类方法(决策树J48、KNN和k-means)分别在训练数据上训练出分类模型,并使用校验数据对各个模型进行测试和评价,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最好的分类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。
2数据的准备及预处理
2.1格式转换方法
(1)打开“ata02.xls” 另存为CSV类型ata02.csv”。
(2)在WEKA中提供了一个“Arff Viewer”模块,打开一个“data02.csv”进行浏览,然后另存为ARFF文件,得到“data02.arff”。 。
3. 实验过程及结果截图
3.1决策树分类
(1)决策树分类
用“Explorer”打开数据“data02.arff”,然后切换到“Classify”。点击“Choose”,选择算法“trees-J48”,再在“Test options”选择“Cross-validation(Flods=10)
系统默认trees-J48决策树算法中minNumObj=2,得到如下结果
=== Summary ===
Correctly Classified Instances 23 88.4615 %
Incorrectly Classified Instances 3 11.5385 %
Kappa statistic 0.7636
Mean absolute error 0.141
Root mean squared error 0.3255
Relative absolute error 30.7368 %
Root relative squared error 68.0307 %
Total Number of Instances 26
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0.824 0 1 0.824 0.903 0.892 N
1 0.176 0.75 1 0.857 0.892 Y
Weighted Avg. 0.885 0.061 0.913 0.885 0.887 0.892
=== Confusion Matrix ===
a b -- classified as
14 3 | a = N
0 9 | b = Y
使用不同的参数准确率比较:
minNumObj 2 3 4 5 Correctly Classified Instances 23
(88.4615 %) 22
(84.6154 %) 23
(88.4615 %) 23
(88.4615 %) 由上表,可知minNumObj为2时,准确率最高。
根据测试数集,利用准确率最高的模型得到的结果:
分析说明:
在用J48对数据集进行分类时采用了10折交叉验证(Folds=10)来选择和评估模型,其中属性值有两个Y,N。一部分结果如下:
Correctly Classified Instances 23 88.4615 %
Incorrectly Classified Instances 3 11.5385 %
=== Confusion Matrix ===
a b -- classified as
14 3 | a = N
0 9 | b = Y
这个矩阵是说,原来是“Y”的实例,有14个被正确的预测为“Y”,有3个错误的预测成了“N”。原本是“NO”的实例有0个被正确的预测成为“Y”,有9个正确的预测成了“N”。“14+3+0+9=26”是实例的总数,而(1
您可能关注的文档
- 基于图像预处理的二维码识别技术的研究报告方案.doc
- 基于图像大数据的目标识别算法及在智慧旅游中的应用研究报告方案.doc
- 基于图像处理的公路裂纹检测方法研究与实现报告方案.doc
- 基于图论和非线性规划求最佳搜救路线问题数学模型报告方案.doc
- 基于特点提取和形态理论的实时自动小目标检测报告方案.doc
- 基于苏州近三年中考历史试卷的几点想法报告方案.doc
- 基于四信ZigBee技术在无线远程路灯监控系统(F8914)报告方案.doc
- 基于四阶段法的城市轨道交通客流预测模型研究报告方案.doc
- 基于思维外显化教学的计算思维培养的研究(最终打印版)报告方案.doc
- 基于顺应论的商务英语函电中模糊语的应用分析报告方案.doc
最近下载
- 岛津原子吸收分光光度计AA-6300软件硬件基本操作AA-6300-rj手册说明书.pdf VIP
- The Magic of Ordinary Days《平凡岁月的魅力(2005)》完整中英文对照剧本.docx VIP
- 注册税务师备考课件.pptx VIP
- MECG1000心电图机培训.pptx VIP
- 国内外CO2催化转化技术发展现状与未来展望.docx VIP
- 道路运输企业双重预防机制建设资料(安全风险分级管控和隐患排查治理).pdf
- HG∕T 5421-2018 噻唑膦原药(可复制版).pdf
- 括号里最大能填几326题.pdf VIP
- 公司物业服务投标方案(技术方案).docx VIP
- 实验动物学学堂云学堂在线课后题答案.docx VIP
文档评论(0)