6—2案例2电信客户流失(程建华).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6—2案例2电信客户流失(程建华)

Statistics Department of Economic School of Anhui University;电信行业数据挖掘 ——客户流失研究之商业理解;电信行业数据挖掘 ——客户流失研究之商业理解;字段名称;字段名称;字段名称;电信行业数据挖掘 ——流失问题研究之数据准备;电信行业数据挖掘 ——流失问题研究之建模和评估;Modeler 14.2;文件:数据理解_各种费用比例和流失的关系.str;文件:建立模型_研究不同客户群流失情况.str;6. 案例分析;6. 案例分析;理解数据挖掘 应用/建模图;电信行业数据挖掘 ——流失问题研究之模型发布; 您需要将您对数据挖掘结果是否达到业务成功标准的评估记录在案。在报告中考虑以下问题: 您的结果是否明确声明并且采用可以轻松展示的格式? 是否存在应该突出强调的特别故事或独特的发现问题? 您是否能够按照模型和发现的问题对于业务目标的适用顺序对他们进行排序? 总的来说,这些结果能在多大程度上满足您组织的业务目标? 您的结果还引发了哪些其他问题?您将如何使用商业术语表述这些问题? 评估完结果后,编辑汇总一个已批准的模型列表以包含在最终报告中。此列表应该包含同时满足您组织的数据挖掘目标以及业务目标的那些模型。;如果要评估模型的准确度,则需要对一些记录进行评分,并将模型预测的响应与实际结果进行比较。接下来对用于评估该模型的相同记录进行评分,以将观察到的响应与预测响应进行比较。 表在名为 $R-Credit rating 的字段中显示预测分数,该字段由模型创建。我们可以将这些值与包含实际响应的原始信用评价字段进行比较。 按照惯例,在评分过程中生成的字段的名称基于目标字段,但是要加上标准前缀,例如 $R- 表示预测值,$RC- 表示置信度值。不同的模型类型使用不同的前缀集。置信度值是模型自己的评估,尺度从 0.0 到 1.0,表示每个预测值的精确程度。 与预期的一样,预测值与大多数(并非全部)记录的实际响应相匹配。原因是每个 终端节点均有混合响应。预期值与最常见的响应相匹配,但对于该节点中的其他响应,该预期值是错误的。(记住,16% 的少部分低收入客户没有拖欠。) 若要避免出现此情况???应继续将树分割为更小的分支,直到每个节点都是不含混合响应的 100% 纯节点为止—即全部为优良或不良。但是,这样的模型可能会非常复杂,并且不易推广到其他数据集。; 增益图 红线为“随机线”,即随机抽取总体数据的预测结果,是参照基线,$Best-流失评分线是“理想线”,即模型准确预测应得到的结果,中间三条即三个模型的实际预测的累计增益结果。模型曲线越靠近理想线,与随机线包围面积越大,模型的预测效果越好,上图三个模型均很靠近理想线。横轴表示总体数据的百分比,图中可以看出,利用总体约45%的数据已经可以通过这三个模型达到接近理想线的预测结果。; 提升图 提升图与累计增益图解释类似,均是描述模型预测的准确性,它衡量与不利用模型(即图中红色的基线)相比,模型的预测能力“变好”了多少。由图可以看出,各模型的峰值也是在总体约45%的位置,超过45%,模型的提升值趋于下滑,即利用总体45%的数据就可以使三个模型的预测效果靠近理想线,说明三个模型的预测结果均是可靠的。增益图与提升图都显示C5.0决策树模型预测流失评分离基线最远,在三个模型中应该优先考虑C5.0决策树模型。;谢谢!

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档