基于weka的数据分类和聚类实验选读.docVIP

  • 9
  • 0
  • 约5.55千字
  • 约 10页
  • 2017-03-08 发布于湖北
  • 举报
基于weka的数据分类分析实验报告 1实验基本内容 本实验的基本内容是通过使用weka中的三种常见分类和聚类方法(决策树J48、KNN和k-means)分别在训练数据上训练出分类模型,并使用校验数据对各个模型进行测试和评价,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最好的分类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。 2数据的准备及预处理 2.1格式转换方法 (1)打开“ata02.xls” 另存为CSV类型ata02.csv”。 (2)在WEKA中提供了一个“Arff Viewer”模块,打开一个“data02.csv”进行浏览,然后另存为ARFF文件,得到“data02.arff”。 。 3. 实验过程及结果截图 3.1决策树分类 (1)决策树分类 用“Explorer”打开数据“data02.arff”,然后切换到“Classify”。点击“Choose”,选择算法“trees-J48”,再在“Test options”选择“Cross-validation(Flods=10) 系统默认trees-J48决策树算法中minNumObj=2,得到如下结果 === Summary === Correctly Classified Instances

文档评论(0)

1亿VIP精品文档

相关文档