Logistic数据挖掘模型实际应用案例.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
理解数据挖掘的注意事项4-关注那些错误的预测 回归是通过具有已知值得变量来预测其他变量的值。在最简单的情况下,回归采用线性回归这样的标准统计技术。 但是,很多问题时不能用简单的线性回归所能预测的。如商品的销售量,股票价格,产品合格率等,很难找到简单有效的方法来预测。因为要描述这些事件的变化所需的变量太多,且这些变量本身往往是非线性的,故要使用非线性回归方法,比如逻辑回归,决策树,神经网络等。 回归模型简要介绍 Logistic 回归是一种统计方法,它可根据输入字段的值对记录进行分类。这种统计方法类似于线性回归,但是它使用的是分类目标字段而非数值目标字段。 Logistic模型分为二项logistic模型和多项logistic模型,主要就在于目标变量是多少个类别。 目标变量中如果含有两个截然不同的类别,可以使用二项logistic模型。如果目标变量中含有多个类别,则可以使用多项logistic模型。 多项logistic回归模型,主要是用来对多因素影响的事件进行概率预测,它是普通多元线性回归模型的进一步扩展,logistic模型是非线性模型。 logistic模型简介 Logit模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logistic regression,“逻辑回归”)是离散选择法模型之一,属于多重变量分析范畴,是社会学,生物统计学,临床、数量心理学、市场营销等统计实证分析的常用方法。 Logit模型是最早的离散选择模型,也是目前应用最广的模型。 logit 模型简介 logistic回归模型基本原理 logistic回归的主要用途:最主要用于分类和预测。 一是寻找危险因素:如寻找某一疾病的危险因素等。 二是预测:如果已经建立了logistic回归模型,则可以根据模型,预测在不同的自变量情况下,发生某种情况的概率有多大。 三是判别:实际上跟预测有些类似,也是根据logistic模型,判断属于某种情况的概率有多大,如看一下这个人有多大的可能性是属于某病。 logistic模型主要用途 logistic回归的主要应用方向: 1.在国外广泛的应用于银行信贷用户等级划分,在国内主要用于电信业客户的流失及预测分析。 2. 在流行病学和医学中最常用的分析方法 3.对一般反应变量为分类变量或二分变量的都可以用logistic解决。 logistic模型主要应用方向 logistic应用示例——二项logistic回归——客户流失 假设某个电信服务提供商非常关心流失到竞争对手那里的客户数。如果可以使用服务使用数据预测有可能转移到其他提供商的客户,则可通过定制服务使用数据来尽可能多地保留这些客户。 客户流失分析之商业理解 通信业是一个竞争异常激烈的行业,对于通信运营商来说,如何对其客户进行有效的管理,尽可能的减少客户的流失和跳网是一个紧迫的问题。可以使用服务使用数据预测有可能转移到其他提供商的客户,则可通过定制服务使用数据来尽可能多地保留这些客户。 数据挖掘技术将提供功能强大的模型,可以回答“哪些客户最可能流失?”和“为什么这些客户会流失?”等问题。 因为目标含有两个截然不同的类别,因此将使用二项模型。如果目标中含有多个类别,则会转而创建多项模型。 客户流失分析之数据理解 字段名称 字段含义 指标解释 gender 性别 age 年龄 income 收入 收入 address 地址 地址,文本型 region 宗教 宗教 tenure 支付方式 话费支付方式——预交还是后付 ed 教育程度 集合型 … … … 顾客信息资料 (共1000条记录,41个变量) 客户流失分析之数据准备 把CDR月度数据汇总成6个月的总体数据 根据CDR数据生成各种不同的平均数据和组合数据 归并客户信息数据、CDR数据与话费数据 对客户现在类型的合理性进行简单分析 客户流失分析之建立模型和模型评估 客户流失分析之模型发布 对每个特定客户的流失可能性进行打分评估 写回数据库 logistic应用示例——二项logistic回归——客户流失 logistic应用示例——二项logistic回归——客户流失 logistic应用示例——多项logistic回归——客户分类 假设某个电信服务提供商已按照服务使用模式对其客户群进行了划分,将这些客户分类到四个组中。如果可使用人口数据预测组成员,则可以为单个预期客户定制服务使用模式。 logistic应用示例——多项logistic回归——客户分类 世间万物的事情发生多多少少会有一些关联。一件事情的发生,很可能是也会引起另外一件事情的发生。或者说,这两件事情很多时候很

文档评论(0)

153****9595 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档