- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《关于“电信业客户流失预测”
关于“电信业客户流失预测”/bbs/showthread.php?t=16350
理论背景客户流失分析或客户流失预测:通过离网调研和数据挖掘,捕捉客户离网前的特征,预测客户流失的概率。这对于优质客户的保护是十分重要和有效的分析手段。对于客户流失预测,从两个方面来看:一个是客户流失预警,一个是流失客户特征分析。客户流失预警:定义统一的预警模型,根据预警模型,客户话单数据中自动匹配预警数据,预警模型可以按如下规则定义,并且可以灵活扩展。流失客户特征分析:通过决策数算法,分析流失客户特征,然后通过这些特征得到当前在网客户中匹配流失概率高的客户数据。通过客户流失分析获得流失客户数据和潜在流失客户数据,从而将这些数据分配给客户服务部门,整合销售服务资源,根据客户的需求,设计个性化的营销策略,快速反应,以此达到召回流失客户,挽留流失概率高的客户,实现对客户的守护。(摘自人民邮电报)现实背景随着电信行业竞争的加剧,客户流失的规模越来越大,周期越来越短;电信业新增客户和客户流失模式,就犹如往没有底的水桶中倒水。分析方法客户流失分析的流程到处都在讲,不外乎是:1. 分析主题确定及数据指标的选择;2. 数据仓库数据提取及清洗;3. 不相关指标剔除;4. 用训练数据建立模型;5. 用测试数据检验模型;6. 预测新的流失用户,并提取用户名单;为了引起更多的这方面的探讨,本人有的一些想法,先现世:其实本人认为关键是指标的选择,以及模型建立前的资料的分类,这样将增加模型的准确性,后面的步骤都是水到渠成,但有关这方面的探讨确实很少,应用的实例就更少了。一般电信运营商客户资料主要包括:1.客户背景资料:年龄、性别、收入。。。2.客户消费行为:是否欠费,流失前半年平均消费额\消费趋势,话费构成...3.其他:交费方式,设备使用类别..其实能够想到的指标都可以放上去,然后从定性和定量的角度考虑剔除大家想到有什么新的指标都可以跟帖
原贴在我的Blog上:这个帖子是我在数据挖掘研究院上的一篇回贴,原贴我也放在本文的下方:我曾经看过所谓预警模型,只是对一些指标设定阈值,然后多个指标加权评分之后,得到总预警评分,若超过阈值,则提出预警。问题在于:这种思路有些一刀切,指标的选取和阈值的设定都存在很大的人为性,也缺乏有效性评估,所以个人觉得没有太大的实践价值。再谈流失预测分析,业界普遍都是采用决策树算法来建立模型。同意heilql的一些看法,包括挖掘流程的大致描述、指标选择是重点等。其实在我们以前所做的多个客户流失预测项目中,更重要的还有:明确业务问题的定义和如何运用挖掘结果来指导客户挽留活动。以下分别简要说明: 明确业务问题定义我一直觉得数据挖掘就是个不断尝试的过程,没有定式。也许挖掘人员掌握了一些套路,但是在你明白要做什么以及数据的情况到底如何之前,其实你是不能给客户任何保证的。业务问题定义类似于需求分析,只有明确了业务问题才能避免多走弯路,浪费人力物力。对于客户流失预测来说,一般要明确这几个问题:-什么叫做流失?什么叫做正常?(严格定义好0和1)-要分析哪些客户?(比如在移动通信行业,很可能要对签约客户和卡类客户分开建模,还需要排除员工号码、公免号码等等)-分析窗口和预测窗口各为多大?(用以前多久范围的数据来预测客户在以后多久范围内可能流失) 变量选取、数据探索和多次建模这个类似于heilql所提到的指标选择,也许变量是更常用的说法;) 电信业的绝大多数数据都可能被探查并用于建模过程。一般我们分为如下几类:-客户基本信息(年龄、性别、在网时长、当前状态。。。)-客户账单信息(账单金额、优惠金额、明细账单金额。。。)-客户缴费信息(缴费次数、缴费金额、欠费次数、欠费金额。。。)-客户通话信息(通话次数、通话时长、短信次数、呼转次数、漫游次数。。。)-客户联络信息(投诉次数、抱怨次数。。。)这些变量的数目很多,而且还会根据需要派生出很多新变量,比如近一月账单金额和近三月账单金额的比例(用于反映消费行为的变动)。建议挖掘人员把所有能拿到数据都探索一遍,然后逐步明确哪些变量是有用的。而对于一个公司来说,事先能给出一份比较全面的变量列表,也正体现了他们在这方面的经验。对于挖掘新手来说,多思考,多尝试,也会逐渐总结出来。 对业务的指导(模型的发布及评估反馈)挖掘人员常常是技术导向的,一旦建立好流失预测模型并给出预测名单之后,常常觉得万事大吉,可以交差了。但是对于客户来说,这远远不够。一般来说,客户投资一个项目,总希望能从中获益,因此在验收时领导最关注的问题可能是:数据挖掘对我的ROI有什么提升?要给客户创造价值,就需要通过业务上的行动来实现。No Action
您可能关注的文档
最近下载
- HG-T20570_工艺系统工程设计技术规范.pdf VIP
- 2025年福建高考生物卷及答案(新课标卷).docx VIP
- NAD-C388-C368-中文使用说明书手册1.pdf VIP
- Error-proofing防错培训-ppt课件.pptx VIP
- 110kV电缆敷设.doc VIP
- 设计思维模型.pptx VIP
- (高清版)DB62∕T 3064-2024 绿色建筑评价标准.docx VIP
- 2024版《中华人民共和国劳动法》培训课件.ppt VIP
- 第七章信息系统、信息设备和保密设施设备管理制度.pdf VIP
- 40MWp光伏发电项目110kV输电线路工程安全设施设计.docx VIP
文档评论(0)