- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘技术的电信客户流失预测
摘要:电信客户流失是我国电信企业发展中所面临的一个严重的问题,为此需要在客户流失之前作出预测,并通过相应营销手段挽留客户,该文主要讨论通过数据挖掘技术建立客户流失预测模型,以此获取即将离网的用户,并通过预测分析过程中的相关数据确定用户类型,作为营销手段选择的主要依据。
关键词:客户流失;数据挖掘
中图分类号:TP311文献标识码:A文章编号:1009-3044(2009)13-3437-02
1 引言
在目前,电信运营商面临激烈的市场竞争,客户争夺愈演愈烈,每个企业都存在客户流失的问题。传统意义上来讲,留住一个客户所需要的成本是争取一个新用户成本的1/5,尤其对于增量客户越来越少的通信市场来说,减少客户流失就意味着用更少的成本减少利润的流失。
电信业客户流失预测是利用客户的历史记录数据,对潜在的流失客户进行判断的过程,相关系统实现通常是基于数据挖掘技术,数据挖掘技术与传统数据分析的区别在于前者是在未有任何假设和前提条件下完成的,有效的数据挖掘预测系统可更客观的对实际的市场情况进行分析和描述。在欧美等发达国家,由于其移动通信市场已经比较成熟,电信运营商的经营模式已经由传统的“技术驱动”过渡到了“市场驱动”和“客户驱动”的运营模式。这就从客观上推动了客户流失行为预测技术的发展。例如,英国电信(BT)、美国的西南贝尔、Vanguard Cellular,ATT Wireless等公司都逐步开始使用客户流失行为预测技术对客户流失进行管理和控制,实施差异化、一对一的营销。在我国,电信行业处于特定的历史发展阶段,我国在数据挖掘方面的研究虽落后于国外运营商,但该技术的重要性已越来越受国内运营商重视。中国移动自2007年开始,已在其中国移动研究院中专门成立了一个进行用户数据挖掘的小组。广东省电信公司研究院在数据挖掘技术基础上研发的“电信客户洞察系统”,也已成为广东电信CRM(客户关系管理)系统的核心子系统。
2 数据挖掘技术
2.1 数据挖掘技术简介
数据挖掘是数据库领域中最重要的课题之一,它是一种知识发现的过程,主要基于统计学、人工智能、机器学习等技术,高度自动化地分析数据,做出归纳性的推理,从海量数据中挖掘出潜在的、有价值的知识、模型或规则,并对未来情况进行预测,以辅助决策者评估风险、做出正确的决策。“数据挖掘包含了一系列旨在从数据集中发现有用而尚未发现的模式(Pattern)的技术”[1],对于企业而言,数据挖掘有助于发现业务发展的趋势,揭示已知的事实,预测未知的结果,并帮助企业分析出完成任务所需的关键因素,以达到增加收入、降低成本,使企业处于更有利的竞争位置的目的。
数据挖掘主要有以下类型:
1) 分类。这是最常见的数据挖掘类型,其中数据的目标数据项表示数据所代表的对象的类型。例如在医学应用中,对象可分为有病和没病两类;在金融应用中,对象可分为低风险和高风险两类。分类数据挖掘先从一个己分类的数据集(训练集)得到一个模型,这个模型就包含了从该训练集中得到的知识。然后应用这个模型(知识)对新的未分类的数据进行分类。
2) 聚类。聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。
3) 预测。通过分析代表对象过去和现在行为的数据来预测对象未来的行为。这实际上是一种特殊的分类或估计,其目标数据项就是要预测的值.
4) 关联分析。确定哪些数据对象存在关联,典型的应用是确定在超级市场中顾客会将哪些商品放在一个购物车或购物篮中,即他们会同时购买那些商品。
2.2 部分数据挖掘算法
1) 决策树
决策树,又称判定树,是一种类似二叉树或多叉树的树结构。它起源于概念学习系统(CLS:Concept Leaning System)。决策树使用的是“分而治之”的策略。它将一个复杂的问题分成更简单的问题并重复使用这一战术来解决子问题,从而将复杂的问题瓦解。
2) 贝叶斯定理
贝叶斯定理是一种对属性集和类变量的概率关系建模方法,主要解决在已知相关项目B的资料,而缺乏论证项目A的直接资料时,通过对B项目的有关状态及发生概率分析推导A项目的状态及发生概率,即当已知事件Bi的概率P(Bi)和事件Bi已发生条件下事件A的概率P(A│Bi),则可运用贝叶斯定理计算出在事件A发生条件下事件Bi的概率P(Bi│A)。
3) 人工神经网络
一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的
文档评论(0)