数据挖掘建立一棵决策树题库.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘实验报告 姓名:  XXX 班级:   XXXXX   学号:   XXXX   2012年12月3日 题目:建立一棵决策树(BASKETS1n数据文件) 要求:(1)用C5.0模型建立剪枝前、后的模型,进行analysis分析(1)用C5.0模型建立剪枝前、后的模型,并进行analysis分析,具体步骤如下: 首先双击Var.File节点,并导入Baskets1n数据Var.File接入一个table节点,执行数据,得 3)给Var.File接入一个Type节点,读入数据,得 4)给Type接入一个Derive节点,命名为“healthy”,类型为浮点型,即 5)满足“healthy”的条件为同时购买了“果蔬”和“鱼”,如图 6)给Derive接入一个table节点,执行后发现多了“healthy”一列,即 7)给healthy接入一个Type节点,选好输入、输出与无关变量,如图 8)给Type接入一个C5.0节点,命名为“before tree”,如图 9)打开before tree,得下图 样本共1000人,其中小于或等于24岁的有277人,城镇居民不是健康食品者的有140人,置信度98.6%;非城镇居民是健康食品者的有137人,其中刷卡消费是健康食品者的有55人,包括女性28人,男性27人,置信度85.2%,现金消费是健康食品者的有53人,包括女性26人,男性27人,置信度88.5%,支票消费是健康食品者的29人,置信度89.7%。大于24岁的不是健康食品者的723人,置信度95.4%。 10)点击Viewer得到bofore tree的决策树如下图 11)给before tree接入一个Analysis节点,作如下处理 执行,得 图示说明,输出的结果中总体为1000个,正确的有947个,占94.7%,错误的有53个,占5.3%。其中本来不是健康食品者判断为不是健康食品者的有842人,是健康食品者判断为不是健康食品者的有13人,不是健康食品者判断为是健康食品者的有40人,健康食品者判断为健康食品者的有105人。使用刷卡消费的共420人,判断正确的有401人,占总体95.48%,错误的19人,占4.52%,这其中本来不是健康食品者判断为不是健康食品者的有356人,是健康食品者判断为不是健康食品者的有6人,不是健康食品者判断为是健康食品者的有13人,健康食品者判断为健康食品者的有45人。以后分析类似前者,在此不做赘述了。 12)这时,得到 13)双击打开before tree,重命名为cut tree,Mode选为“simple”,执行得 样本共1000人,其中小于或等于24岁的有277人,城镇居民不是健康食品者的有140人,置信度98.6%;非城镇居民是健康食品者的有137人,置信度80.3%,大于24岁的不是健康食品者的723人,置信度95.4%。 14)点击Viewer得到cut tree的决策树如下图 15)给cut tree接入一个Analysis节点,作如下处理 执行得 图示说明,输出的结果中总体为1000个,正确的有938个,占93.8%,错误的有62个,占6.2%。其中本来不是健康食品者判断为不是健康食品者的有828人,是健康食品者判断为不是健康食品者的有27人,不是健康食品者判断为是健康食品者的有35人,健康食品者判断为健康食品者的有110人。使用刷卡消费的共420人,判断正确的有397人,占总体94.52%,错误的23人,占5.48%,这其中本来不是健康食品者判断为不是健康食品者的有352人,是健康食品者判断为不是健康食品者的有10人,不是健康食品者判断为是健康食品者的有13人,健康食品者判断为健康食品者的有45人。以后分析类似前者,在此不做赘述了,由以上分析对比图11)执行后的结果对比,剪枝后不如剪枝前精确,正确率降低了。 16)这时,得到 (2)考虑cost时决策树的模型,具体情形如下: 1)打开cut tree,重命名为cost before tree,Mode选为“Expert”,设置相关值如下 2)打开cost before tree,得下图 3)点击Viewer得到cost before tree的决策树如下图 4)这时,得到 5)双击打开cost before tree,重命名为cost cut tree,Mode选为“simple”,执行得 6)打开cost cut tree,得下图 7)点击Viewer得到cost cut tree的决策树如下图 与(1)中13)相对比可

文档评论(0)

bbnnmm885599 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档