- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
技术广角技术广角
数据挖掘技术
在电信行业
异常客户识别
中的应用研究
1 1 2 2
熊仕平 王 雷 李 勇
1中国联通湖南分公司 长沙 410008
2清华大学博士后科研工作站 北京 100084
摘要:主要讨论数据挖掘技术在电信行业的应用,以异常客户的识
别为例阐述了数学挖掘模型的构建与使用。
关键词:数据建模 数据挖掘 主成分分析 异常客户
1 引言 题。根据已有的异常客户数据归纳其特性,
随着电信运营商逐渐从 “以业务为中 当拥有新的客户数据时,以此预测识别具有
心”向“以客户为中心”的转变,电信运营 异常倾向的客户,如识别具有离网倾向或欺
商迫切需要对各种业务的客户满意情况进行 诈倾向的客户。这样可有助于改进电信运营
分析和预测,对客户构成以及客户行为进行 商的服务水平,减少收益流失,增强客户的
预测识别。而借助数据挖掘技术构建的数学 忠诚度等。
模型恰恰可以解决分群客户的偏好归纳、客 在建立异常客户分析模型过程中,将根
户离网倾向预测、客户欺诈行为识别等运营 据实际模型的效果对影响客户异动行为的相
商最为关心的问题。由于客户离网以及客户 关变量做进一步的约简和处理。
欺诈等客户异常行为直接关系到电信运营商
最关心的收益提高问题,因此本文主要以异 2.1数据属性约简
常客户识别为例介绍电信行业数据建模技术 影响异常客户判定的影响属性通常多种
应用。 多样,这些属性之间存在着或强或弱的相关
关系,以全部属性作为细分标准显然过于复
2异常客户分析模型 杂,并且也难于在实时环境中识别和追溯目
异常客户分析识别主要是对电信客户所 标;而任意选取其中某个或某几个属性又会
处状态的一种判断,其本质是一种分类问 影响对客户异常行为的解释力度,降低细分
80 TELECOMMUNICATIONS TECHNOLOGY / 2006·3
效果。因此,较为有效的方法是从这 量的分析达到解决问题的目的。在 数较少的互不相关的新的组合变量
些相互关联的影响属性中,通过约 这种降维思想下便产生了处理高维 进行分析来达到解决问题的目的。
简算法抽取对客户异常行为起关键 数据的主成分分析 (Principal例如,假设影响客户离网的属性有
影响的属性;或者对这些属性进行 Component Analysis)法。 服务价格、通话质量、信号覆盖率、
抽取整合,重新构造少数关键指标, 2.1.2多规则神经网络 电话掉线率以及客户信用度等,对
这些指标是原有影响属性 (或称因 使用多规则神经网络进行属性 客户的这5个影响属性用 “1~10”
子)的线性组合,能综合原有影响属 约简是将原始属性数据作为多准则
文档评论(0)