基于数据挖掘的电信行业客户流失管理研究.docxVIP

下载本文档

15
0
约3.28千字
约 6页
2017-01-02 发布于贵州
举报
版权申诉

　基于数据挖掘的电信行业客户流失管理研究.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

DUFE信息系统研究方法与问题基于数据挖掘的电信行业客户流失管理研究学号： 2013100654 专业：电子商务姓名：徐麟基于数据挖掘的电信行业客户流失管理研究研究背景2008年中国对电信运营企业进行了重组，中国移动和中国联通合并运营TD—SCDMA网络，中国电信与中国联通C网合并运营CDMA2000网络，中国联通G网和中国网通合并运营WCDMA网络，从而形成了移动、电信、联通三足鼎立的局面，电信公司之间的竞争也越来越激烈。对电信企业来说，客户是最重要的资源，也是生存和发展的必需品。客户资源是电信运营企业的根本，保留并巩固客户资源意义重大。而在当前中国电信市场下，电信运营商为了争夺客户，除了通过简单的价格竞争以外，还不断推出各种新的套餐和新的业务来优先获得客户资源，双卡情况越来越严峻，这就在很大程度上加大了客户的不稳定性，使得客户在三家运营商之间不断做出选择的现象频繁发生。据官方统计，中国移动客户的离网率近几年不断攀升，2013年全年离网率高达50%左右。从客户关系管理理论上看，开发一个新用户的成本是保留一个有价值老用户的5-10倍，因此在新增电信客户不断下降的时候，想要保持企业持续增长的利润就需要在挽留老客户这一相对低成本高收益上想办法。研究的目的和意义本文的研究目的就是在对电信客户流失等业务知识的理解和研究一些常用的数据挖掘方法上，依据数据挖掘建模流程，研究并实现一个准确实用的的客户流失预测模型和流失客户分类模型，并结合广丰县移动客户数据进行分析，对分析结果进行评估验证。在对客户流失预测模型和流失客户分类模型进行评估和结果分析的基础上，得到了有效的客户流失规则集，并给出预测的准确率，同时依据流失客户分类结果对客户的挽留策略提出一些意见和建议。最后对所做的理论研究工作、实验工作和实验中所遇到的问题以及下一步工作进行总结。研究的主要方法和手段数据挖掘的定义数据挖掘技术是数据库知识发现的核心技术,产生于二十世纪八十年末,至今大约经历了 30年的发展历史,但它的定义却没有一个被完全认同。因为数据挖掘技术被广泛地应用到互联网、电子商务、零售、电信等各个领域在不同的领域应用也不同,因此各专家及学者也分别对数据挖掘进行定义:数据挖掘就是从众多的、不完整的、有杂质的数据中,挖出隐含在里面的、人们以前不清楚的、但又是潜在存在的有用信息的过程。简单地说,数据挖掘就是从众多的数据中找出有用的信息,如图所示,数据挖掘被认为是知识发现过程中的一个步骤。图1数据挖掘的过程数据挖掘的任务数据挖掘的任务主要是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。(1)关联分析(AssociationAnalysis)关联规则挖掘是由Rakesh Apwal等人首先提出的。两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。(2)聚类分析(Clustering)所谓聚类[55],就是按照事物的某些属性聚集成类,使得类间的相似性尽可能的小,类间的相似性尽可能的大。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。聚类分析的算法可以分为以下几大类:分裂法、层次法、基于密度的方法、基于网格的方法和基于模型的方法等。(3)分类(Classification)分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类可被用于规则描述和预测。(4)预测(Predication)预测是利用历史业务数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常使用预测方差来度量。(5)时序模式(Time-seriesPattern )时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。(6)偏差分析(Deviation)在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之问的差别。在本文中需要数据挖掘完成的任务主要是对电信客户流失数据的分类及预测。3、数据挖掘过程模型本文准备采用CRISP-DM模型来进行数据挖掘。CRISP-DM模型定义了 6个阶段,分别是:商业理解(Business Understanding)、数据理解(Data Unders