- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验六分类和回归树节点(C
实验报告
学院
南徐学院
班级姓名
朱亚军
成绩
课程
名称
数据挖掘
实验项目
名 称
分类和回归树节点(CRT)
指导教师
教师评语
教师签名:
年 月 日
实验目的
1、掌握CRT分类算法。
2、掌握决策树的建立和修剪
3、了解CRT分类算法在管理决策中的应用。
二、实验内容
1、CRT分类算法建立决策树
三、实验步骤
分类和回归树节点 (CRT) 是一种基于树的分类和预测方法,此方法使用递归分区将训练记录分割为多个具有相似的输出字段值的段。在本示例中,将 CRT 应用于某市场研究,其中的目标字段为有意预订有线电视交互服务。预测变量字段包括年龄、性别、教育、收入类别、每天看电视的时间和子女数(按有序集合编码,因为值 8 表示 8 个或更多)。
此示例使用名为 Newschancart.str 的流,此流引用名为 NewsChan.sav 的数据文件。可以从任何 Clementine Client 安装软件的 Demos 目录下找到这些文件,也可以通过从 Windows 的开始菜单下选择 Start [All] Programs SPSS Clementine 12.0 Demos 来访问这些文件。文件 Newschancart.str 位于 Base_Module 目录下。
1、创建树
要创建流,可执行下列操作:
在 Demos 文件夹中添加指向 NewsChan.sav 的 SPSS 文件源节点。为流添加类型节点。
在类型节点中选择读取值以实例化字段。选择 NEWSCHAN 并将其类型设置为标志,将其方向设置为输出。其他所有字段用作预测变量(输入)。
将 CRT 节点连接到类型节点。在“模型”选项卡上,选择启动交互会话作为构建选项。这样,在执行节点时将启动“交互树”窗口,通过该窗口可以在生成模型之前生成并编辑树。
在“专家”选项卡上选择专家模式并选择修剪树和使用标准误规则。将最小杂质改变值设置为 0.003。增加此值可避免进行改进意义十分微小的分割,从而倾向于生成较简单的树。
要指定停止标准,可在“专家”选项卡上单击停止。在“停止标准”对话框中选择使用绝对值。将最小绝对临界值更改为 25 和 10,然后单击确定。
行节点。此时将出现交互树窗口,在其中可以生成并编辑树。
最初,仅显示根节点。统计显示训练数据中有 442 个记录。因为尚未分割树,因此所有的记录 (100%) 都落在此节点中。在整个示例中,有 215 个记录对预订的响应为是,其总响应率为 48.6%。使用树模型,我们可以尝试是否能够通过找到最有可能作出积极响应的子组来提高此匹配率。
提示:要查看字段标签,例如否和是响应的标签,可单击菜单栏上的显示字段和值的标签按钮
在“查看器”选项卡上,单击根节点以选中它并从菜单中选择以下项:
树 生成树和修剪
生成的树具有五层和五个终端节点。(要查看整个树,可使用缩放工具或单击工具栏右侧的图窗口工具按钮。)如果尚未选中修剪选项,则树可能会复杂得多。修剪操作基于成本复杂性算法,此算法可根据终端节点数调整风险评估。
2、生成模型和节点以便评分
使用决策树时,共有几个选项可用于生成或导出会话结果。其中两个常用的选项为根据当前树生成模型或根据当前树生成选择节点。这些选项会在下面各节中进行说明。
有关其他选项的说明,例如过滤节点和规则集,请参阅 Clementine 帮助。
根据当前树生成模型
可使用此流生成模型,该模型可根据分配到节点的记录的积极响应率对这些记录进行评分。在交互树窗口的“查看器”选项卡上,从“生成”菜单中选择生成模型。
此时将出现“生成新模型”对话框。 在“生成新模型”对话框中,输入新模型的名称(可选),然后单击确定。 该模型位于流工作区中。
在流工作区中,将生成的 NEWSCHAN1 模型连接到类型节点。
在生成的 NEWSCHAN1 模型中,单击设置选项卡,选择计算置信度和规则 ID,然后单击确定。
连接表节点并执行流。
已执行的表中显示了可能接受有线电视服务预订的用户的记录。$R-NEWSCHAN 列显示了对这些记录的预测结果。如果某记录显示的值为 1,则可以预测该用户对预订的响应为是。
如果需要,可将此生成的模型保存到模型选项板上以备将来的数据使用。右键单击流中的 NEWSCHAN1 模型并选择添加到模型选项板。然后单击模型选项板上的模型并选择保存模型。
生成选择节点
还可以生成选择节点,该节点包括所有落在节点 2 和 13 中的记录。然后,可以使用具有新数据的选择节点确定哪些用户最有可能对预订做出积极的响应。
? 在交互树窗口中,使用按住 Ctrl 键并单击的方法选中节点 2 和 13。
? 从“生成”菜单中,选择选择节点。
生成的选择节点位于流工作区中。
您可能关注的文档
- 天融信火墙配置指南.doc
- 太阳能水系统方案.doc
- 太阳能池概述.doc
- 太矿室工程方案.doc
- 太阳能伏电源系统.doc
- 太阳能池发展现状及高效率的实例.doc
- 太阳能池的芯片材料及转换效率.doc
- 央视大平立面图.doc
- 天蓝色景墙新中式客厅装修效果图布局装扮个性的家.doc
- 套项做.doc
- 2025年03月成都市“蓉漂人才荟”武侯区公开考核公开招聘事业单位工作人员(16人)笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 【临沂】山东临沂蒙阴县乡镇街区事业单位面向优秀村(社区)党组织书记招聘笔试历年典型考题及考点剖析附带答案详解.docx
- 【南阳】2022年河南安阳市北关区招聘事业单位工作人员76人笔试历年典型考题及考点剖析附带答案详解.docx
- 【唐山】2025年河北唐山市市直事业单位公开招聘工作人员277人笔试历年典型考题及考点剖析附带答案详解.docx
- 2025年04月中共玉环市委社会工作部公开招聘工作人员2名笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2025年02月天津市财政局事业单位公开招聘10人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2024年10月南通启东市社会化工会工作者公开招聘4人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2024年10月贵州省道真仡佬族苗族自治县公安局面向社会公开招考40名警务辅助人员(第二批)笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2025年03月上海市公共卫生临床中心公开招聘50人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 【南阳】2022年河南南阳市西峡县医疗健康服务总医院招聘122人笔试历年典型考题及考点剖析附带答案详解.docx
最近下载
- 2025年国家能源集团神华工程技术有限公司社会招聘(100人)笔试模拟试题及答案解析.docx VIP
- 监理细则-(真空预压).doc VIP
- 2025至2030年中国交联pvc泡沫行业市场全景评估及投资前景展望报告.docx
- 山东临沂经济开发区城市建设投资有限公司招聘笔试题库2023.pdf VIP
- 家具史:法国洛可可家具.pptx VIP
- 首诊负责制试题及答案.pdf VIP
- 充泥管袋袋装碎石抛石等工程监理实施细则.doc VIP
- 2025年国家能源集团神华工程技术有限公司社会招聘(100人)笔试备考题库及答案解析.docx VIP
- 2024年全国中考语文试题汇编——议论文阅读及答案.docx VIP
- 2025国家能源集团神华工程技术有限公司社会招聘100人考试备考题库及答案解析.docx VIP
文档评论(0)