基于car算法的客户流失预测模型研究.docxVIP

基于car算法的客户流失预测模型研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于car算法的客户流失预测模型研究 通信公司之间的竞争非常激烈。客户在不同运营商之间的转换网络经常发生,即所谓的客户损失。客户流失会给运营商带来经济和市场损失。因此,各运营商都会十分看重客户的流失,都会采取一定的营销措施来减少客户的流失,比如,用预存话费,送话费或手机等活动阻止客户转网。如果通信企业能够预测哪些客户会流失,运营商就能有针对性的制定营销措施,从而防止他们流失。本文就是以移动通信公司为例,提供一种预测客户流失的模型,从而为公司的营销措施制定提供帮助。 1 基于cart算法的建模预测 通过对已流失客户的信息详细分析,根据他们的通话、职业等情况,把这些客户分成不同的类,然后如果有新的客户信息符合这些类中的某一类时,说明客户可能流失的程度,运营商就可以采取相应的措施来预防流失。根据其定义可以得出,采用分类、回归技术比较合适。而常用的分类、回归算法通常有决策树、神经网络。决策树在分类和预测数据挖掘方法中属最简单易懂的一种,同时也是一种非常有效的分类算法。因此,本文采用决策树中的CART算法来进行建模预测。CART决策树算法是目前应用最广泛的预测技术,它主要由决策节点、分支和叶子3部分组成。建立CART决策树的过程也就是树的生长过程,主要利用信息论中的信息增益理论,通过寻找数据集中具有最大信息量的字段,建立CART决策树的一个节点,再根据该节点字段的不同取值建立树的各个分支,在每个分支中重复上述过程,逐步建立树的下层节点和分支,最终可以生成反映一定规则的决策树。 2 建立数学模型 通过实际的分析和验证表明,客户流失分析项目的实施一般要经历下面几个过程:确定分析目标、搜集数据、建立模型、评估结果和部署应用等,在对模型使用的过程中,要根据预测和实际结果对比修改模型,逐步完善模型。 2.1 网客户消费数据的流失用户的界定 建立模型主要会用到:客户档案信息、客户合同信息、客户通话清单等。根据建模的需要,对上述数据变量进行抽取、组合得到如下所示的标本变量如表1所示。 选取3个月以上的在网客户消费数据作为标本数据,如果这些用户在这3个月后的紧接着的3个月内发生流失,就将其定义为已流失用户,反之则为非流失用户。通过对移动通信公司提供的10000条抽样数据进行清洗、异常处理等操作,共获得如表2所示的1250条符合要求的数据集。 2.2 分类回归树模型的建立 有了上面的数据,按照70%和30%的原则,将这些数据划分成训练集和数据集,利用70%的数据建立分类回归树模型,利用剩余的30%进行测试,也既是对树进行剪枝,确定最优树。建立模型包含对客户进行分组和预测分析两个部分。 2.21 客户的消费情况 这里采用聚类分析算法对客户进行分组。聚类分析算法即通过对目标数据库中的记录进行分析,然后按照一定的分类规则,将每个记录划分到不同的记录分组中。通过这种方法,可以有效地把数据划分到不同的分组中,同时确保组和组数据之间的差别尽可能大,组内尽可能小。因此,选聚类分析算法的参数K为9,对前面所得记录首先进行分组,得到表3所示的4种不同的典型客户群。 从表3可以看出,第1种客户占总客户的比例并不大,而且花费下降比例也比较正常,就是一点,拨打了客户服务热线。一般来讲,如果没有什么疑问,客户是不会拨打客户服务热线的。因此,我们首先确认他是拨打的哪个运营商的服务热线,如果是拨打的外网的客服热线,那么就要根据他的消费情况和此运营商的进行对比,看有什么区别。如果是拨打内网的,那就根据记录情况了解他咨询的问题,针对他们提出的问题进行制度相应策略。 第2种客户占客户总数的比重很大。因此,这类客户需要认真对待。此类客户的主要消费行为是与网内用户通话比例较高,其它并没有什么异常。对于这类客户,可以针对他们的消费情况采用更能吸引他们的营销措施以超过竞争方提供的条件来减少其流失的可能性。 可以明显看出第3种客户连续几个月话费下降比例都较高,这种类型的客户可能是和某类型的人联系的少了,或者是工作调动情况而导致的。因此,对于此类用户则需要详细了解他们的工作和生活情况,从而制定符合其消费特点业务。 第4种客户所占总客户的比例也是很小,而且这类客户消费情况没有太大的异常出现,对于这类客户可以了解他们的基本信息,在相应单位或社区进行移动业务介绍,给他们推荐新的业务及优惠情况,从而引导他们消费,减少其流失的可能性。 通过聚类分析得出的上述结果可以有效地帮助市场部工作人员制定适合的市场策略及开展精确营销,从而减少客户流失。 2.22 叶节点节点的客户流失可能性分析 对于上面的客户分类,只是粗略的分析而已,要想知道具体的流失特性和流失概率,还需要建立决策树来进行分析。下面将利用CART算法,建立模型。 使用CART算法并进行10次交叉验证,得到如图1所示的移动客户可能流失的分析模型。其中,客户

文档评论(0)

lgjllzx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档