- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Clmentine实验报告.doc
实验报告
学 号: 姓 名: 专 业:金融学
一、实验名称:SPSS Clementine 11.0的应用
二、实验目的:通过对SPSS Clementine 11.0中所附实例——有线电视服务销售(CR树)的实践,初步掌握对该软件的操作。
三、实验过程及结果:
1.打开数据源:NewsChan.sav.
2.输出表,可以看到该数据源中包涵的字段及信息。其中包涵教育、性别、年龄、每天看电视时长、子女数、收入水平、是否有意订购有限电视等8个字段,442条信息。接下来通过对着442个样本的分析,挖掘出那些群体真正订购有线电视服务的可能性最大。
3.将是否有意订购有限电视服务这一字段设为输出变量。
4.建立CR决策树。在“模型”选项卡中选择“启动交互会话”作为构建选项,以便生成“交互树”窗口,对决策树进行选择和编辑。
5.在“专家”选项中选中“专家”并对最大代理数以及最小杂志改变进行设置,同时对停止标准以及修剪树规则进行设置,这样倾向于产生简单的树,避免改进对意义十分微小的分支。
6.设置完成后,执行该节点,出现交互树界面。最初只显示根节点,由此可以看出,总共442个样本数据,有可能预定的为215个,占48.6%。
7. 整个决策树如下,共五层。由于之前有设置修剪,所以决策树比较简单明了。图中的每个节点是按照不同的变量分的,例如第一个节点是按照年龄来分,第二个节点是按照收入分的。
8、由树可以看出,年龄在40.5岁以上的是“是”的几率占近68%,响应积极,在40.5岁及以下的响应率较低,接着在其下根据收入水平进一步提高其响应率,直至到最后一层将其响应率从34.5%提高到60.5%。
9.查看此树的收益表。节点2和节点13拥有最高的指数值,同预期一样。节点2的指数近140%,这表明,从节点2的样本中选择获得积极响应的概率会是随机选择获得积极响应的140%倍。
10.查看其指数提升图。可以看出节点2与13的样本中至少包含了全体样本积极响应的50%以上。
11.查看完后,生成模型,并以表格的形式输出。查看表格,可以通过﹩R-NEWSCHAN查看到各样本最终响应的结果。
以上便是整个数据挖掘的过程。
五、实验总结及感悟:
1.这个实例是通过CR决策树来确定真正愿意订购有线电视服务的用户。只有对模型熟悉掌握,才能在数据挖掘的过程中将不纯洁度降到最低,得出最显著的结果。
2. 因为对数据和模型的掌握欠佳,所以我是在参考了整个示例过程后才开始进行此次实验的,过程中对于模型的理解比较费力,在这一方面需要加强,真正要掌握好这个软件,还需要大量的学习实践过程。
2013.12.20
文档评论(0)