- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验3-------决策树
clementine决策树分类模型
一.基于决策树模型进行分类的基本原理概念
分类就是:分析输入数据,通过在训练集中的数据表现出来的特性,为每一个类找到一种准确的描述或者模型。由此生成的类描述用来对未来的测试数据进行分类。
该范例的背景是客户的作为一种市场营销活动的结果
图1 总流程图
三. 数据集说明
数据集.db,以下是该数据集的所有字段名:
? id. 唯一的识别
? age. 年龄
? sex. 性别
? region.地理位置
?
? merried. 是否已婚
? children. 有几个孩子
? car. 是否有汽车
? save_act. 是否有储蓄账户
? current_act. 是否有活期存款
? mortgage. 是否有抵押
? pep. 是否有个人投资计划
四. 训练模型
通过下面的操作,将完成如图2所示的流。
图2 训练模型
导入数据及预处理
插入一个变项文件节点(Source\Var.File),双击该节点,在File框输入snapshottrainN.db的物理路径,如图3所示:
图3 输入节点
变量类型的定义及实例化:
在建模之前,我们首先将一个类型节点Type Node加到目前的流程中。因为需要用为引数来估计
图4 Type节点
查看数据源
通过一个Table节点(Output\Table)与源数据连接,Excute(执行)Table结点即可,如图5所示:
图5 Table节点
用C5.0算法建立决策树模型
建立一个C5.0结点(Modeling\C5.0)与Type节点相连,如图6所示::
图6 建模过程
双击C5.0结点可对其进行编辑,这里取其Model name为默认值“Auto”(进入法),其他选项也不做修改,Excute(执行)该节点,如图7所示:
图7 建模过程参数选择
模型结果分析
执行C5.0结点即可得到判断pep取值的决策树模型,如图8所示:
图8 查看模型
右键单击模型,单击Browse查看模型结果,如图9所示:
图9 模型结果
将模型图标与Type节点相连,再添加一个“分析”节点,执行Analysis节点显示预测值和真实值的匹配程度如何的信息,如图10所示:
图10 模型好坏分析
五. 测试模型
现有新的数据snapshottestN.db,将建好的分类模型(pep)加入到流程中,并利用Analysis节点分析结果,如图11所示:
图11 测试模型
(1)导入数据及预处理
与上面的方法相同,建立变项文件节点,选取源数据snapshottestN.db,如图12所示:
图12 输入节点
预处理数据,与训练模型操作相同,如图13所示:
图13 测试数据筛选
(2)查看数据源
通过一个Table节点(Output\Table)与源数据连接,Excute(执行)Table结点即可,如图14所示:
图14 查看测试数据
(3)连接模型
将得到的回归模型加入到Type节点,如图15所示:
图15 连接模型
双击C5.0结点可对其进行编辑,这里取其Model name为默认值“Auto”(进入法),其他选项也不做修改,Excute(执行)该节点,如图16所示:
图16 测试模型参数选择
分析模型
将模型图标与Type节点相连,再添加一个“分析”节点,执行Analysis节点显示预测值和真实值的匹配程度如何的信息,如图17所示:
图17 测试模型的分析结果
文档评论(0)