基于数据挖掘的客户流失的研究综述.pdfVIP

基于数据挖掘的客户流失的研究综述.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘的客户流失研究综述 中国移动福建公司福州分公司支撑中心林向阳 【摘要】 客户流失分析研究对企业降低运营成本.提高经营业绩有着极为重要的意义。文章阐述了数据挖掘的应用及其存在的 问题。提出数据挖掘的基本方法并进行比较。同时,总结了近年来数据挖掘技术在客户流失方面的研究,探讨了进一步的研究方向o 【关键词】 数据挖掘;客户流失;综述;客户关系管理 1概述 5)偏差检测。数据库中的数据常有一些异常记录.从数 客户流失分析研究对企业降低运营成本,提高经营业绩有 据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如 着极为重要的意义。数据挖掘是从存放在数据库、数据仓库或 分类中的反常实例、不满足规则的特例等。 . 其他信息库中的大量数据中挖掘有趣知识的过程【¨。在国内。 3.3数据挖掘的基本过程 目前数据挖掘主要集中在需要对海量数据进行分析研究的行业 目前比较流行的数据挖掘方法论主要有以NCR,SPSS大 领域。尤其是电信行业12J。 data 2客户流失的概念 提出的通用数据挖掘方法(伽genericIIliningmethod), 顾名思义,流失客户即是企业原有客户不想或不再使用该 企业服务的,称为流失客户【3J。 大同小异的。 从总体上可以根据客户流失的程度,把客户流失分为两 根据NCR和SPSS公司提出的跨行业标准数据挖掘过程 类:离网流失和业务流失,也有人把这两类流失称为显性流失 CRISP-DM【9】。数据挖掘的基本过程包括了以下的步骤:商业 和隐性流失I,,“。 理解、数据理解、致据准备、建立模型、模型评估以及结果发 离网流失是指客户从现有企业转向处于竞争关系的其他企 布。 业.或者是同一用户在同一企业所拥有的不同服务之问进行转 变。以及随着客户生命周期的结束而终止服务的现象。 业务流失指客户的某类消费,虽然投有完全停止消费,但 部分使用丁竞争对手的服务或替代品。与其历史消费量相比成 显著性下降的现象。 3关于客户流失的数据挖掘应用及其存在问题 3.1数据挖掘的概念 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、 随机的实际应用数据中。提取隐舍在其中的、人们事先不知道 的、但又是潜在的有用信息和知识的过程【8l。 3.2数据挖掘的基本分类 数据挖掘按功能可以分为以下五类f。l: 1)自动预测趋势和行为。数据挖掘自动在大型数据库中 寻找预测性信息,可以迅速直接由数据本身得出结论。 2)关联分析。数据关联是数据库中存在的一类重要的可 被发现的知识。若两个或多个变量的取值之间存在某种规律 性,就称为关联。 3)聚类。数据库中的记录可被化分为一系列有意义的子 囝1 CRISP—DM方法论的流程囝 集。即聚类。 4)概念描述。概念描述就是对某类对象的内涵进行描述。 3.4客户流失分析的特点与问题 并概括这类对象的有关特征。 客户流失分析具有以下一些特点,这些特点为数据挖掘带 2008年增刊49 来了挑战性的问题: 测方法.它们的基本算法有以下几种【14】:决策树方法、贝叶斯 1)客户数据特别是电信客户的数据具有数据量大,业务 分类方法、K一近邻方法、粗糙集方法、基于案例方法、遗传 逻辑复杂的特点。这种情况下,应用使用历史数据建立的挖掘 模型进行数据挖掘的结果往往和实际结果产生较大的偏差№】。 系方法(如CLIM、FMCT等最大团发现算法116’)。 2)客户数据的数据复杂、数量巨大、范围广泛:

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档