RapidMiner实验报告.docxVIP

  • 85
  • 0
  • 约 7页
  • 2017-02-06 发布于重庆
  • 举报
RapidMiner实验报告

实验报告实验目的:使用RapidMiner对数据进行分析实验工具:RapidMiner 6.5实验数据:DatingDate.csv实验数据说明:实验数据是通过研究对象的三种特征,一个是每年坐飞机飞行的里程数miles,二个是玩视频游戏所耗时间的百分比gamepercent,每周消费的冰淇淋公升数icecream,来判断一个人是否具有吸引力(didnt like、smallDoses,lagerDoses)实验过程:打开RapidMiner 6.5,新建一个Process导入数据DatingData.csv,如图所示点击下一步到出现如图所示界面,将Response设为label最后将数据存储在如下图的位置,命名为TrainingData,点击finish完成将数据TrainingData拖拽到process窗口中,用线连接至result接口,可以看到如下数据其中有些Response的值丢失了,共有31个这时需要使用Filter Examples 过滤掉没有值得Response行,操作如下图数据筛选完成之后,选择Decision Tree Model,拖入到process中,连接起来,参数选择默认设置训练好模型之后,我们可以用模型预测一下TrainingData中没有标记的样例,与上面的数据过滤方法相同,只是设置有所不同,如下图使用Apply Model来运用模型整个连接图如下所示实验的预测结果部分决策树截图为了测试上面说的决策树模型的预测能力,我又做了下面的一些如图,加入一个Validation其参数如下图,默认的10表示将样例分为十份,取一份作为测试数据双击Validation右下角的矩形表框进入,建议决策树模型,应用模型退出Validation 如图连接到result运行输出结果如下上图显示准确率为96%左右,正负误差为1.69%,表明训练所得模型是比较稳定的实验总结1.我在这个过程中运用的测试集与训练集是相同的,这可能会使整个模型的预测能力比实际要偏大2.该实验的难点是数据源的收集与筛选,选择什么样的数据,需要怎样的处理才有意义是不容易的3.模型算子的选择对于我来说比较难,因为对这个是不熟悉的,所以基本上所有的参数都是默认的,这个感觉不太好4.对结果的分析不是很明白

文档评论(0)

1亿VIP精品文档

相关文档