实验3-------决策树.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验3-------决策树

clementine决策树分类模型 一.基于决策树模型进行分类的基本原理概念 分类就是:分析输入数据,通过在训练集中的数据表现出来的特性,为每一个类找到一种准确的描述或者模型。由此生成的类描述用来对未来的测试数据进行分类。 该范例的背景是客户的作为一种市场营销活动的结果 图1 总流程图 三. 数据集说明 数据集.db,以下是该数据集的所有字段名: ? id. 唯一的识别 ? age. 年龄 ? sex. 性别 ? region.地理位置 ? ? merried. 是否已婚 ? children. 有几个孩子 ? car. 是否有汽车 ? save_act. 是否有储蓄账户 ? current_act. 是否有活期存款 ? mortgage. 是否有抵押 ? pep. 是否有个人投资计划 四. 训练模型 通过下面的操作,将完成如图2所示的流。 图2 训练模型 导入数据及预处理 插入一个变项文件节点(Source\Var.File),双击该节点,在File框输入snapshottrainN.db的物理路径,如图3所示: 图3 输入节点 变量类型的定义及实例化: 在建模之前,我们首先将一个类型节点Type Node加到目前的流程中。因为需要用为引数来估计 图4 Type节点 查看数据源 通过一个Table节点(Output\Table)与源数据连接,Excute(执行)Table结点即可,如图5所示: 图5 Table节点 用C5.0算法建立决策树模型 建立一个C5.0结点(Modeling\C5.0)与Type节点相连,如图6所示:: 图6 建模过程 双击C5.0结点可对其进行编辑,这里取其Model name为默认值“Auto”(进入法),其他选项也不做修改,Excute(执行)该节点,如图7所示: 图7 建模过程参数选择 模型结果分析 执行C5.0结点即可得到判断pep取值的决策树模型,如图8所示: 图8 查看模型 右键单击模型,单击Browse查看模型结果,如图9所示: 图9 模型结果 将模型图标与Type节点相连,再添加一个“分析”节点,执行Analysis节点显示预测值和真实值的匹配程度如何的信息,如图10所示: 图10 模型好坏分析 五. 测试模型 现有新的数据snapshottestN.db,将建好的分类模型(pep)加入到流程中,并利用Analysis节点分析结果,如图11所示: 图11 测试模型 (1)导入数据及预处理 与上面的方法相同,建立变项文件节点,选取源数据snapshottestN.db,如图12所示: 图12 输入节点 预处理数据,与训练模型操作相同,如图13所示: 图13 测试数据筛选 (2)查看数据源 通过一个Table节点(Output\Table)与源数据连接,Excute(执行)Table结点即可,如图14所示: 图14 查看测试数据 (3)连接模型 将得到的回归模型加入到Type节点,如图15所示: 图15 连接模型 双击C5.0结点可对其进行编辑,这里取其Model name为默认值“Auto”(进入法),其他选项也不做修改,Excute(执行)该节点,如图16所示: 图16 测试模型参数选择 分析模型 将模型图标与Type节点相连,再添加一个“分析”节点,执行Analysis节点显示预测值和真实值的匹配程度如何的信息,如图17所示: 图17 测试模型的分析结果

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档