- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ClementineC5.0模型预测CDMA客
户流失
纲要:该文针对当前电信行业中一个日益严峻的问题:客户
离网进行研究,经过收集客户的基本数据、消费数据和缴费行为等数
据,成立客户流失预测模型,进行客户流失剖析及预测。经过对大量
有关技术和统计方法的研究,最终确定了clementine的C5.0模型
作为电信客户流失的预测模型。此模型对客户流失预测有较高的正确
性,为电信经营剖析系统作了有益的尝试与探索。
重点词:数据挖掘;客户流失;统计剖析;C5.0模型;
CDMA客户
概括
以中国电信云南某公司的项目支撑为基础,从统计数据来
看,维持5%的老用户增长,给电信公司带来的收益将远远超过85%,而要想把一位非电信用户发展成客户,其成本将比保存一位老客户的成本高得多,统计数据表示成本是4倍左右,此时,客户对电信的忠实程序也将发生强烈的变化,由此给公司造成的损失将大大增加。从
项目的实施情况来看,为了保证成功向客户推销营运商的产品,多半人都只愿意愿老客户推销。因为由此付出的代价比用户要小得多,成功率也要高得多。经过这些数据我们能够看到防范老客户的流失相比发展新用户来说就显得尤为重要了,这也是普遍公司最为关注的问题之一。
第1页共6页
免责声明:图文根源网络搜集,版权归原作者所有。
若侵犯了您的合法权益,请作者持权属证明与本站联系,我们将实时改正、删除!谢谢!
2研究现状及C5.0模型特点
在我们国内,好多营运商为了应付市场的竞争,多半都己经成立了“电信经营剖析系统”,这在一定程序上为深层次的数据剖析提供了优秀的数据办理剖析平台。而当前国内在数据利用上确远远不及外国的层次深,国内的数据应用主要集中在固定报表办理、查问剖析和个人的主观探索,在更高领域的应用如数据挖掘还不太成熟,更谈不上深层次的应用。而这些在外国,好多著名的电信营运商却已经能够很好地利用数据挖掘技术,以便经过成立客户流失的模型,提升收益空间及对一些流失概率比较高的客户进行有针对的保存工作,这样做的目的可能有效地控制入网用户的流失。
Clementine作为一个数据挖掘软件,给营运商创建了很好的数据办理应用平台,在此平台下,营运商能够有效地使用一些商业技术正确、快捷地成立预测的模型,尔后把由此模型生成的数据使用在推销应用领域。参照行业履行标准CRISP-DM模型,我们能够有效地改良决议过程,这不单能够数据到更优商业成就的数据挖掘。
而且还能够这样能够剖析出哪些属性是影响客户流失的重要因素。现在比较流行的流程包括决议树、神经网络、逻辑回归、聚类关系性剖析等。本文选择的是C5.0模型节点来进行电信的客户流失预测。该模型的工作原理是根据在每个级别提供最大信息收获的字段切割样
本,目标字段必须为分类字段,允许进行多次多于两个子组的切割。它往常会根据不同的字段再次切割由第一次切割定义的每个子样本,且此过程会重复下去直到无法持续切割子样本。
第2页共6页
免责声明:图文根源网络搜集,版权归原作者所有。
若侵犯了您的合法权益,请作者持权属证明与本站联系,我们将实时改正、删除!谢谢!
C5.0能够生成两种模型:
1)决议树是对由算法成立的切割的简单描绘,每个终端(或
“叶”)节点可描绘训练数据的特定子集,而训练数据中的每个观察
值都完全属于树中的某个终端节点。
2)规则集则是尝试对单个记录进行预测的一组规则,规则
集源自决议树,并且在某种程度上表示在决议树中成立的经简化或提
取的信息版本。关于所存在的问题,比如缺失数据和大量输入字段,
C5.0模型十分稳重,往常不需要花费很长的训练时间用于估计。同
时C5.0模型与其他模型种类相比更容易理解,解释起来更简洁易懂。
3建构并应用C5.0模型
在clementine中使用C5.0模型进行电信客户流失预测的过程包括:找到数据源:本例中数据源为鉴于Excel的电子表格,翻开Clementine,在对话框中选择数据源项,能够直接双击我们要使用的Excel进行编写,在导入文件中选择要用的数据源。然后在选
项板中选择字段节点,进行种类编写,设置客户流失项为输出项。接下来在建模里根据需要选择合适的特点选项,此时,该节点会根据设置的条件(如缺失的百分比)筛选出可删除的字段,如预测变量,依据我们的挖掘需求,保存的预测变量,并按重要性进行排序。生成过滤节点后,在里面可看到保存了对输出(也就是客户的流失标志)有影响的项,去掉了对输出没什么影响的项。总的挖掘过程和过滤如图1-图2所示。
接着我们在模型里面选择C5.0模型,编写模型的选项,
第3页共6页
免责声明:图文根源网络搜集,版权归原作者所有。
若侵犯了您的合法权益,请作者持权属证明与本站联系,我们将实时改正、删除!谢谢!
有四种用于建立C5.0模型的训练方法:1.输出种类:指定希望生成的结果模型是决议树
您可能关注的文档
最近下载
- 初级会计职称考试教材《经济法基础》.pdf VIP
- 《运筹学》考试题及其答案.docx VIP
- 开题报告:人工智能赋能大学生心理健康状况自动监测及应用研究.docx
- 2024语文义务教育课程标准.pdf VIP
- 慢性缺血性脑血管病的护理PPT课件.pptx VIP
- 国家开放大学《创新思维训练与方法》形考任务1-4参考答案.pdf VIP
- 初中语文作文写作策略指导研究教学研究课题报告.docx
- IATF16949最新内审检查表整套.xls VIP
- 2023-2024学年四川省成都市成华区石室中学七年级下学期期中数学试卷及参考答案.pdf
- 重庆医科大学2022-2023学年《细胞生物学》期末考试试卷(A卷)附参考答案.docx
文档评论(0)