基于联合决策树的客户流失预测模型设计.doc

基于联合决策树的客户流失预测模型设计.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于联合决策树的客户流失预测模型设计

2010年第 5期 总第 177期 J ISUANJ I YU X IANDA IHUA 文章编号 : 1006 22475 ( 2010) 0520005 203 基于联合决策树的客户流失预测模型设计 郭俊芳 ,周生宝 (山西大同大学数学与计算机科学学院 ,山西 大同 037009 ) 摘要 :为了解决电信行业客户流失预测模型中流失者和未流失者比例偏斜问题 ,模型依据数据挖掘原理 ,以 CR ISP2DM ( C ro ss2indu stry Standa rd P roce ss fo r D a ta M in ing)建模过程为框架 ,采用了多基决策树联合决策的思想 。模型避免了训练 出一棵“空 ”决策树 ,把所有客户都预测为未流失的问题 。与单个分类器相比 ,提高了预测模型的查准率和泛化能力 。 关键词 :客户流失预测 ; 决策树 ; 多基决策树联合决策 ; 数据挖掘 中图分类号 : TP311 文献标识码 : A do i: 10. 3969 / j. issn. 100622475. 2010. 05. 002 D e s ign of C u stom er s C hurn Pred ic t ion M ode l Ba sed on M u lt i2c la ss if ier C la ss2com b in er GUO J un2fang, ZHOU Sheng2bao ( Co llege of M a them a tic s and Comp u te r Sc ience, Shanxi D a tong U n ive rsity, D a tong 037009 , Ch ina) A b stra c t: In o rde r to we ll re so lve the h igh ly skewed c la ss d istribu tion be tween chu rn s and no2chu rn s, the cu stom e rs chu rn p red ic2 tion mode l is rea lized acco rd ing to the CR ISP2DM ( C ro ss2indu stry Standa rd P roce ss fo r D a ta M in ing) fram ewo rk. The m u lti2c la s2 sifie r c la ss2com b ine r app roach is adop ted. The mode l cou ld no t re su lt in a‘nu ll’p red ic tion system tha t simp ly p red ic ts a ll in2 stance s a s non2chu rne rs. Comp a red w ith a single c la ssifie r, the accu racy and gene ra liza tion of the mode l a re imp roved. Key word s: cu stom e rs chu rn p red ic tion; dec ision tree; m u lti2c la ssifie r c la ss2com b ine r; da ta m in ing 0 引 言 1 建模步骤 模型按照 数据 挖 掘的 行业 标 准 CR ISP2DM [ 5 ] 逐 步建立 。挖掘过程分为商业理解 、数据理解 、数据准 备 、建立模型 、评估模型 、发布模型等 6 个子过程 ,这 6个子过 程 可 以 反 复 迭 代 , 直 至 达 到 商 业 理 解 的 要 求 。图 1 为本模型数据理解和准备的流程图 。 随着行业竞争的加剧 ,客户频繁流失给电信业 、 银行业 、保险业等公司的效益和营销管理带来了很大 的影响 。怎样尽早发现有流失倾向的客户 ,客户为什 么要流失 ,以及怎样成功挽留客户是公司需要解决的 问题 [ 1 ] 。 Ga rtne r公司调查数据表明 , 开发一个新 客 户的费用是维持一个老客户的 4~5倍 [ 2 ] 。 用数据挖掘方法建立客户流失预测模型就是对 客户基本自然属性与历史行为属性的数据进行深入 分析 ,抽取出客户流失属性特征后用一定的挖掘算法 建立客户流失预测模型 ,从而预测在网客户未来一段 时间内流失可能性以及流失原因 ,为客服部门进行客 2 多基决策树联合决策算法 2. 1 算法思想 数据整理 好 后 , 按比 例抽 样形 成 训练 集 和 测 试 集 ,用训练集训练模型 , 用测试集

您可能关注的文档

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档