- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Clementine自带实例_多项式Logistic回归_精品
电信客户分类(多项式Logistic回归) 译者注:Logistic regression应该翻译成Logistic回归,而非逻辑回归,因为本身跟逻辑没有什么关系 * 本文档翻译自Clementine的自带应用程序实例,错漏在所难免,有问题请e-mail,欢迎粉我微博 e-mail:973599102@ 微博:/datafish 说明 logistic回归是一种基于输入值的记录分类统计技术。它跟线性回归相似但用分类目标字段替换数字字段。 比如,考虑电信服务提供商基于服务使用模式将他们的客户分群成4类。如果人口统计数据能够用来预测组成员,那么您可以为潜在客户定制特定的产品。 使用的流文件%clementine%\demo\Classification_Module\telco_custcat.str 使用的数据文件%clementine%\demo\telco.sav 实例关注使用人口数据预测使用模式。目标字段custcat有四种可能的值,相当于四种客户群,如下: 因为目标有多种分类,所以我们采用多项式模型。而在有两个不同目标的案例中,例如是 /否,真/假,流失/不流失,则可以使用二项式模型代替。参见本系列文档中的电信流失(二项式回归) 添加一个指向telco.sav的SPSS源文件节点 添加一个类型节点以定义字段,确保它们的类型都设置正确。例如,对于大多数只有0值和1值的字段来说应该被设为标志,但某些特定的字段,如性别,应该被更精确的视为双值集合。 小技巧:要改变多个字段的类型,点击“值”字段排序,按下shift键对您要改变的字段进行多选。可右击选择的字段改变选择字段的类型或者属性。 将字段custcat方向设置为输出,其他的都为输入 因为本例关注人口数据,所以使用一个过滤节点过滤其他字段,只包含相关字段(region, age, marital, address, income, ed, employ, retire, gender, reside, and custcat) 您也可以将字段方向设置为无,以把不需要的字段排除在外 在Logistic节点中,点击模型标签,选择逐步法。选择多项式,主效应以及将常量纳入方程式。把目标的基准类别置为1。模型将比较会把订购了基础服务的客户与其他客户比较。 在专家标签中,选择专家模式,选择输出,在高级输出对话框,选择分类表 执行节点产生模型(在右上角的模型面板),右击选择浏览 模型标签展示了用于将记录分类的等式。有四种分类,其中一种为基准类别,因此不会展示等式细节,而只会展示其他三种 汇总标签展示了模型使用的目标字段和输入字段(预测字段/协变量)。我们看到这些都是被逐步法选入的字段,而不是所有的被提交的字段。 在高级标签展示的项目,依赖于建模节点中高级输出对话框所选 有一项总会出现在案例处理过程摘要,那就是落在某分类的记录条数以及比例。这就给了一个可以作为比较基础的基准模型: 如果模型没有使用协变量预测,您应该将客户分配最可能的组,那就是Plus Service。 基于训练数据,如果您把所有的客户都分配到空模型中的一类,您将有28.1%的时间是正确的。高级标签包含更多能让您检验模型预测能力的信息。您可以通过对比基准模型结果来比较这些模型的优劣。 在高级标签的底部,分类表展示了模型的结果,有39.9%的正确率。 我们看到,对Total Service的分类不错,但对E-Service的分类效果很差。如果想提高对E-Service的分类效果,应该找另外的协变量。 依赖您想预测的东西,模型可以完全的满足您的需求。例如如果您不关心识别种类2的客户,模型可以精确的满足您。在本例当中,E-service是损失最大的一项,带来很少利润。 例如您最高的投资回报来自于第3,4类客户,模型给出您需要的信息 要知道模型对数据拟合的怎么样,在建模节点的专家-输出里面有一些选项可以使用。欲知详情可查看帮助文件里的Logistic Model Nugget Advanced Output。Clementine中建模用到的数学方法可以在Documentation目录的Clementine Algorithm Guide.pdf中查到。 我们注意到这些结果仅仅是基于训练数据的。要知道模型对现实世界中的其他数据拟合得怎么样,您可以使用分区节点,保留一部分数据用来测试和确认。详见帮助中的Partition Node。 * * *
您可能关注的文档
- 《毕业设计(论文)-汽车电子稳定程序控制ESP系统》_精品.doc
- YY综采工作面安装作业规程_精品.doc
- mdh即兴演讲技巧-上海海纳川培训中心,当众讲话,演讲口才,形象塑造,商务礼仪,人际关系,有效沟通_精品.ppt
- 会计基础知识读本目录_精品.doc
- 北京XX宾馆康乐部安全生产管理制度汇编_精品.doc
- [作物栽培学课件]-甘蔗_精品.ppt
- 北方X港口多用途码头X号泊位设计_精品.pdf
- 【汇总】15年泸州市专业技术人员继续教育试题答案2015年泸州市公需科目试题及答案心理健康与心理调适_精品.doc
- xx商业城物业运作手册_精品.doc
- 九年级化学 第一单元走进化学世界复习课件 人教新课标版_精品.ppt
- 浙江省温州市浙南名校联盟2025-2026学年高一上学期期中联考数学试题含解析.docx
- 26高考数学提分秘诀重难点34圆锥曲线中的定点、定值、定直线问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点35概率与统计的综合问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点31圆锥曲线中的切线与切点弦问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点30圆锥曲线中的弦长问题与长度和、差、商、积问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点29巧解圆锥曲线的离心率问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点28直线与圆的综合(举一反三专项训练)(全国通用)(含解析).docx
- 寡核苷酸药物重复给药毒性研究技术指南.docx
- 重组溶瘤腺病毒生产质量管理标准.docx
- 26高考数学提分秘诀重难点27直线与圆中常考的最值与范围问题(举一反三专项训练)(全国通用)(含解析).docx
原创力文档


文档评论(0)