- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CRtree的案例应用Clementine应用
CR tree的案例应用——Clementine应用
CR tree全程为 the classification and regression tree,分类回归树是是一种基于树的分类和预测方法,模型使用简单,易于理解(规则解释起来更简明易),该方法通过在每个步骤最大限度降低不纯洁度,使用递归分区来将训练记录分割为组。
2将Type节点加入到数据流中,并进行属性设置。将newschan的类型改为“标志”,方向改为“输出”。
3 加入 C-R tree 节点,在模型设置中选择“启动交互会话”,此功能是在节点被执行之后,在树生成模型前可以对树进行编辑。在“专家”栏中,选择专家模式,使用标准误差规则,将最小杂质改变值设为0.003,这个设置可以形成一个比较简单的树模型。 在停止标准中使用绝对值,父分支中和子分支中的最小记录分别为25,10。
4 运行此模型。
从图中结果可以发现训练数据一共有442个记录,其中215个数据回应为yes,占有约49%。5下面让我们利用树模型看看能否改善这种积极的回应。选择“生长树并修建”选项,结果如下:
在图中我们发现,在关于年龄的第二个节点中,yes的积极回应率增加到68%左右,此时年龄大于40.5。而年龄在小于或等于40.5的节点1具有较低的回应率仅为34.5%,继续向下面的节点看,即使在节点1之后的分类中,也有偏高的回应率如节点13的回应率为60.4%。
6 检查树的收益表。收益指数能够有助于划分每一个节点的目标类别的比例。选择目标类别为1。如下图:
图中所示,节点2和节点13具有最高指数,节点2的指数高达140%,这说明这类群体积极接受的机会是1.4倍。
7 在分位数中选择十分位数,以图表展示提升,目标类别依旧为1。如下图中:
图中显示的是每个增量记录占整体训练数据比率值。结果为在回应率下降的前50%的记录值都可以保留。
8 生成新的模型。对模型进行设置,选择计算置信度以及规则标识符。
9 添加输出图表节点并进行运行。
运行结果如下:
其中$R-NEWSCHAN为最后预测结果,如果为1那么代表会有积极的回应。
10 添加一个选择节点。在newschan交互树窗口中同时选择节点2和节点13,点击选择节点,创建已生成节点,再添加一个输出图表节点,进行运行。
此结果中包含的是落入节点2和节点13中的所有记录,此时生成的结果可以作为之后选择目标的数据。
总结:此案例是在营销研究中应用了CR树节点和决策树。通过模型确定哪些顾客会购买交互式信息服务。通过利用预测因素如年龄、性别、教育程度、收入类别、看电视的时间、孩子数量,通过预测和分类对活动具有最高反映率的数据。
文档评论(0)