数据挖掘02588.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘02588.doc

扭、池球務 滨江学院 题 目 基于数据挖掘的客户流失问题 院 系 计算机系 专业班级 软件工程 学生姓名 许燕 学 号 20082344908 指导教师 闫雷鸣 二0—一年五月二十六日 基于数据挖掘的客户流失问题 摘要:在营销手段口益成熟的今天,我们的客户仍然是一个很不稳定的群体,因为他们的市场利益驷动杠 杆还是偏向于人、情、理的。如何来提高客户的忠诚度是现代-企业营销人一直在研讨的问题。 关键词:客户流失,数据挖掘,决策树,聚类 引言:客户的变动,往往意味着一个市场的变更和调整,一不小心甚至会对局部(区域)市场带来致命的 打击。这个现象在医药企业的处方产品屮突显,一-个医院由一个代表做到一定的销售量,但是这个医药代 表离开麻,那么销量的下滑是很明显的。如果你是公司的管理者,请务必在关键时刻擦亮你的眼睛,以免 你的客户在不经意间流失,给公司的市场运作带來不利影响。当然,这其中的因素和地区的主管、经理也 有很大的直接关系。所以,我们通过数据挖掘来分析数据挖掘问题。我们也对以对比已有的方法发现不足 之处,然后进行改进。 一、 数据挖掘 数据挖掘又称数据库屮的知识发现,是一个利用各种分析工具在海最数据中发现模型和数据间关系的 过程,这些模型和关系可以川來做出预测。数据挖掘实施的步骤一般包括三个部分数据的准备、模型的建 模型验证图数据挖掘的步骤图所示的各个步骤并不是线性的,要取得好的结果就要不断重复这些步骤。在 客八流失分析系统中,数据挖掘只是一小部分,却是关键的一个部分,系统中把数据挖掘得到的知识和市 场的经验、客服的信息结合起来,应用于数据库中的数据进行流失客户的预测、分析,对确认有流失倾向 的客户根据不同的情况进行预苦处理,包括套餐资费调整、服务方式更改、竞争对手调杳等,同时将预誓 客户名单通过公司的数据交换平台下发给各个业务分区,进行摸底跟踪,实施关怀工程。整个系统的业务 流程如图所示,其中流失客户的预测和分析是两个关键的环节,需要选择讨,实用案例,计算机系统应用年 第期合适的数据挖掘算法,获取有用的模型和知识应用于系统中,才能进行科学的辅助决策。 二、 数据挖掘在系统中的应用 流失又分为被动流失和主动流失,被动流失是因为客户欠费或不履行责任而被移动停机。主动流失有 不同的原因,一类是客观原因限制所引起的异动,如搬迁等,另一类是客户主动放弃,如因为竞争对手的 优惠政策,对冃前的服务不满意等。在这些群体中,那些主动流失的客户是我们耍分析的对彖,在这类群体 中,用户价值和信用度高的可能流失客户是我们最关心的对象,如果能够成功预测出这类将要流火的客户, 并且能够成功的挽留这类大客户,将给移动公司带來可观的利润。 三、 基于数据挖掘的电信客户流失分析步骤 1、 商业理解 商业理解是从业务角度来理解数据挖掘的冃标和耍求,再转化为数据挖掘问题。本文的H标确定为:针 对目前在网客户进行流失概率的预测。 电信领域的客户流失有3方面的含义[3]: —是指客户从本电信运营商转往到其他的电信运营 商;二是指客户使用的手机品牌发生改变,从木电信运营商的高价值品牌转向低价值品牌;三是指客户月 平均消费量降低,从高价值客户成为低价值客户。在以上3类客户流失中,第一类是客户流失分 析的重点,本文将第一类作为分析的对彖。而在第一类客户中,又可具体将其分为被动停机3个月、 主动退网和注销用户。 2、 数据理解。 数据理解包括收集原始数据、数据描述、数据探索分析和数据质最描述。 收集原始数据当进行数据挖掘时,首先要从企业数据仓库中取出一个与要搜索问题相关的数据了集。该 问题的数据来源是某电信公司某年度1月?7月在某地区的数据。 数据描述 信息类别数据源时间窗口流失自然用户属性相关行为信息属性 信息类别 数据源 时间窗口 流失 自然 用户 属性 相关 行为 信息 属性 在网 口然 用户 属性 相关 行为 信息 属性 USER BASIC INFO USER_BEHA VIOR_INFO USERBASIC INFO USER BEHA VIOR INFO 某年7刀 某年1刀、2 月、3月 某年7月 某年4月、5 月、5月、6 数据探索分析。 在使用收集到的原始数据之丽,必须要保证所有数据在数量和质量上符合要求。在数据探索阶 段,对获取的各变量进行分析探索,选择对目标变量的影响相对较人的关键变量。此处,通过可视化 的方式来展现,即利用Clementine中的分布图节点展示用户流失状态在每个变最上的分布图。从备分布图 得出,用户的自然属性,例如性别、年龄等信息缺失值比较多”冃存在较多的非法数据,所以在本文的分析中, 不选该类变量,该类变量不参与建模。另外,像通话次数、通话时长等变量和客户流失概率Z间存在着反比 关系,即该类变虽的值越人,则客户流失的概率相对来说就越小

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档