实验七、多项Logistic回归.docVIP

下载本文档

476
0
约1.92千字
约 6页
2016-09-26 发布于安徽
举报
版权申诉

实验七、多项Logistic回归.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

实验七、多项Logistic回归.doc

实验报告学院南徐学院班级姓名朱亚军成绩课程名称数据挖掘实验项目名称多项 Logistic 回归指导教师教师评语教师签名：年月日实验目的 1、熟悉Logistic 回归。 2、掌握Clementine 中Logistic 回归建模方法。二、实验内容 1、在Clementine 中建立多项Logistic 回归三、实验步骤 Logistic 回归是一种统计方法，它可根据输入字段的值对记录进行分类。这种统计方法类似于线性回归，但是它使用的是分类目标字段而非数值目标字段。例如，假设某个电信服务提供商已按照服务使用模式对其客户群进行了划分，将这些客户分类到四个组中。如果可使用人口数据预测组成员，则可以为单个预期客户定制服务使用模式。此示例使用名为 telco_custcat.str 的流，此流引用名为 telco.sav 的数据文件。可以从任何 Clementine Client 安装软件的 Demos 目录下找到这些文件，也可以通过从 Windows 的“开始”菜单下选择 Start [All] Programs SPSS Clementine 12.0 Demos 来访问这些文件。文件 telco_custcat.str 位于 Classification_Module 目录下。本示例将焦点集中于使用人口数据预测使用模式。目标字段 custcat 有四个可能的值对应于四个客户组，如下所示：值标签 1 基本服务 2 电子服务 3 附加服务 4 全套服务在 Logistic 节点上，单击模型选项卡并选择逐步法。选中多项、主效应和将常量纳入方程式。将目标的底数类别保留为 1。模型将对其他客户与预订基本服务的客户进行比较。在“专家”选项卡上，选中专家模式，选中输出，然后在“高级输出”对话框中选中分类表。运行节点以生成模型，该模型会添加到右上角的模型选项板中。要查看其详细信息，请在生成的模型节点上用右键单击并选择浏览。 “模型”选项卡中显示了用于将记录分配到目标字段的每个类别的方程式。因为共有四个可能的类别，而其中之一是底数类别，因此选项卡中有三个方程式，其中类别 3 表示附加服务，等等。 “汇总”选项卡显示了（包括其他内容）模型中使用的目标字段和输入字段（预测变量字段）。注意，这些字段是根据逐步法实际选择出来的字段，不是为进行分析而提交的完整列表。 “高级”选项卡上显示的项目取决于在建模节点的“高级输出”对话框中选中的选项。其中通常显示的一个项目是观测值处理概要，它显示了落在目标字段每个类别中的记录的百分比。这将生成一个空模型用作比较的基础。在不构建使用预测变量的模型的情况下，最好的预计结果可能是将所有的客户分配到最普通的组 3（附加服务组）中。如果基于训练数据将所有客户分配到空模型，则得到的正确率将是 281/1000 = 28.1%。“高级”选项卡还包括其他信息，使您能够检查模型的预测。然后，可将这些预测与空模型的结果相比，以查看使用此数据的模型的执行效果。在“高级”选项卡底部，分类表显示了此模型的结果，其正确率为 39.9%。特别是，此模型在识别全套服务客户（类别 4）时表现优异，而在识别电子服务客户（类别 2）时表现很差。如果想提高预测类别 2 中客户的准确性，可能需要再找到一个预测变量来识别此类客户。依赖于您所期望的预测，模型可充分满足您的需求。例如，如果您对识别类别 2 中的客户并不关心，那么该模型的准确性足以满足需求。这种情况可能是，电子服务仅是一种为吸引顾客而出售且获利微薄的产品。例如，如果投资的最高回报来自于落在类别 3 或类别 4 中的客户，则该模型能够提供所需的信息。当构建模型时，可使用“高级输出”对话框中的大量诊断信息来评估模型实际拟合数据的程度。请参阅Logistic 回归模型高级输出详细信息。 Clementine 中用到的建模方法的数据原理的说明在《Clementine 算法指南》中列出，该指南位于任何 Clementine Client 安装软件的文档目录下；也可以通过从 Windows 的“开始”菜单下选择 Start [All] Programs SPSS Clementine 12.0 文档来访问此文档。四、实验体会熟悉了Logistic 回归并掌握了Clementine 中Logistic 回归建模方法。实验报告实验报告