编码技术生成预测变量提升客户流失预测效果.docVIP

编码技术生成预测变量提升客户流失预测效果.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
编码技术生成预测变量提升客户流失预测效果

用编码技术生成预测变量提升客户流失预测效果Telecom Customer Churn Prediction by VBBA冉建荣 RAN Jian-Jong; 邵培基 SHAO Pei-Ji(电子科技大学,成都 610054) (University of Electronic Science and Technology of China 610054) 摘 要:本文在客户流失预测一般方法的基础上,提出最优算法投票方法框架,并用中国移动某公司客户数据进行了实证研究,通过对实证结果采用ROC曲线进行评估,结果表明:采用最优算法投票方法后,其预测效果优于任何单一模型直接预测的效果。这为客户流失实践中提升客户流失预测精度提供了一套有效的方法。Abstract: 关键词:最优算法投票 客户流失 ROC曲线Key words: Voting Based on the Best Arithmetic; Customer Churn; Receiver Operating Characteristic Curve0 引言客户流失是指客户终止与企业的服务合同或转向其它公司提供的服务[1]。截止2008年12月,中国移动电话用户数达 亿户,手机普及率为 %;固定电话用户数达 亿户,普及率为 % [2],表明国内电信市场逐渐趋于饱和。对电信运营企业来说,在这样一个相对成熟的市场中竞争,防御性市场策略变得越来越重要。防御性市场策略重点关注的是如何减少客户流失,而不是发展新客户和诱使竞争对手的客户转网[3]。Reichheld[4]研究表明,客户保持率每提高5%,行业平均利润增加幅度在25 %~85 %之间。另有研究表明,赢得一个新客户所花费的成本大约是保留一个老客户所花费成本的5~6倍[5]。因此,各电信运营商认识到管理好客户流失问题是提高企业盈利能力的关键,纷纷投入巨资构建各自的客户流失管理系统。客户流失管理主要包括预测可能流失的客户,客户收益的评估及减少客户流失的客户保持策略及方法等几方面[6]。本文以提高客户流失预测精度为目标,提出对客户消费数据进行编码以生成新的流失预测变量的方法,并用中国移动某公司客户数据对采用编码与否的变量集进行比较研究,用ROC曲线对实证结果评估表明:采用编码技术的变量集的预测效果比不采用编码技术的变量集的预测效果要好。文章下面的组织结构如下:第一部分介绍了客户流失预测变量的一般来源;第二部分提出将编码技术用于生成客户流失预测变量的方法;第三部分对采用编码技术前后的两个变量集进行实证研究;第四部分对研究结论作简单评述,并给出实践建议。1 客户流失预测变量的一般来源在以往的研究客户流失预测研究中,预测变量一般来自以下几个方面:客户数据仓库的原始变量 变量求和或取均值连续变量离散化取两个变量的比值手机号:客户的手机号码,是客户的唯一标识码。流失标志:流失记为“1”,非流失记为“0”,是预测的目标变量。在网时长:截止2008年3月底,客户使用公司服务的总时长,单位为月。月均计费时长:客户1~3月月平均计费时长,单位为分钟。月均网间计费时长:客户1~3月月平均网间通话计费时长,单位为分钟。月均通话次数:客户1~3月月平均通话次数,单位为次。月均主叫次数:客户1~3月月平均主叫通话次数,单位为次。月均短信条数:客户1~3月月平均短信条数,单位为条。月均账单费用:客户1~3月月平均账单费用,单位为元。月均基本业务费用:客户1~3月月平均基本业务费用,单位为元。月均新业务费用:客户1~3月月平均新业务费用,单位为元。最近月计费时长变化:3月计费时长与1~3月月均计费时长之比。最近月网间计费时长变化:3月网间计费时长与1~3月月均网间计费时长之比。最近月通话次数变化:3月通话次数与1~3月月均通话次数之比。最近月主叫次数变化:3月主叫次数与1~3月主叫次数之比。最近月账单费用变化:3月账单费用与1~3月月均账单费用之比。最近月基本业务费变化:3月基本业务费用与1~3月月均基本业务费用之比。最近月新业务费变化:3月新业务费用与1~3月月均新业务费用之比。最近月充值标志:3月无充值记为“1”,有充值记为“0”。最近月漫游标志:3月有漫游通话记为“1”,无漫游通话记为“0”。最近月长途标志:3月有长途通话记为“1”,无长途通话记为“0”。最近月月租标志:3月有月租费记为“1”,无月租费记为“0”。最近月呼转标志:3月有呼叫转移记为“1”,无呼叫转移记为“0”。最近月月末余额标志:3月月末余额为非正记为“1”,月末余额为正记为“0”。2 生成客户流失预测变量的编码方法在流失预测变量一般来源基础上,我们进一步采用编码方法生成新的预测变量,以跟踪客户消费行为的变化过程。2.1 对连续变量的编码以下变量按1~3月数值的大小,分别

文档评论(0)

cgtk187 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档