- 5
- 0
- 约3.86千字
- 约 13页
- 2019-09-12 发布于天津
- 举报
数据挖掘实验报告 xxx 201021030483
PAGE
1
基于weka的数据分类分析实验报告
1实验基本内容
本实验的基本内容是通过使用weka中的三种常见分类方法(朴素贝叶斯,KNN和决策树C4.5)分别在训练数据上训练出分类模型,并使用校验数据对各个模型进行测试和评价,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最好的分类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。
2数据的准备及预处理
2.1格式转换方法
原始数据是excel文件保存的xlsx格式数据,需要转换成Weka支持的arff文件格式或csv文件格式。由于Weka对arff格式的支持更好,这里我们选择arff格式作为分类器原始数据的保存格式。
转换方法:在excel中打开“movie_given.xlsx”,选择菜单文件-另存为,在弹出的对话框中,文件名输入“total_data”,保存类型选择“CSV(逗号分隔)”,保存,我们便可得到“total_data.csv”文件;然后,打开Weka的Exporler,点击Open file按钮,打开刚才得到的“total_data”文件,点击“save”按钮,在弹出的对话框中,文件名输入“total_data”,文件类型选择“Arff data files
您可能关注的文档
- 基于JAVA的学生成绩管理系统设计与实现毕业设计(论文)文章教学教材.doc
- 基于Java网页版聊天室的设计与实现毕业论文含开题报告及文献综述文章讲义教材.doc
- 基于JSP的电子商城的设计与实现开题报告文章讲义资料.doc
- 基于KPI的绩效考核上课讲义.ppt
- 基于MATLAB_SIMUCINK仿真技术在电力电子变流技术中应用毕业论文文章教学案例.doc
- 基于Matlab的16QAM通信系统的设计与仿真资料教程.doc
- 基于matlab的人脸测定及其研究本科论文文章教学讲义.doc
- 基于MCGS的小车入库设计毕业设计说明书文章教学材料.doc
- 基于objective-C的项目设计与实现——爆囧趣事毕业论文文章教材课程.doc
- 基于PLC的住宅小区立体停车设备毕业设计论文文章讲义资料.doc
- 互换性与测量技术 第2版 课件 2.4 大尺寸孔轴公差与配合.pptx
- 互换性与测量技术 第2版 课件 7.1 尺寸链的基本概念.pptx
- 互换性与测量技术 第2版 课件 7.4 用极值法计算尺寸链-实例.pptx
- 体育产业概论 课件 第1--7章 导论、体育产业资源 ---体育旅游业.pptx
- 体育旅游(第二版)课件 第二章 体育旅游资源.pptx
- 体育旅游(第二版)课件 第三章 体育旅游者.pptx
- 体育产业概论 课件全套 曹可强 第1--14章 导论、体育产业资源 ---体育产业政策.pptx
- 互换性与测量技术 第2版 课件 1.5 标准更新说明.pptx
- 体育旅游(第二版)课件 第四章 体育旅游市场.pptx
- 体育旅游(第二版)课件 第五章 体育旅游目的地.pptx
原创力文档

文档评论(0)