- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于联合决策树的客户流失预测模型设计
2010年第 5期
总第 177期
J ISUANJ I YU X IANDA IHUA
文章编号 : 1006 22475 ( 2010) 0520005 203
基于联合决策树的客户流失预测模型设计
郭俊芳 ,周生宝
(山西大同大学数学与计算机科学学院 ,山西 大同 037009 )
摘要 :为了解决电信行业客户流失预测模型中流失者和未流失者比例偏斜问题 ,模型依据数据挖掘原理 ,以 CR ISP2DM
( C ro ss2indu stry Standa rd P roce ss fo r D a ta M in ing)建模过程为框架 ,采用了多基决策树联合决策的思想 。模型避免了训练 出一棵“空 ”决策树 ,把所有客户都预测为未流失的问题 。与单个分类器相比 ,提高了预测模型的查准率和泛化能力 。 关键词 :客户流失预测 ; 决策树 ; 多基决策树联合决策 ; 数据挖掘
中图分类号 : TP311
文献标识码 : A
do i: 10. 3969 / j. issn. 100622475. 2010. 05. 002
D e s ign of C u stom er s C hurn Pred ic t ion M ode l Ba sed on M u lt i2c la ss if ier C la ss2com b in er
GUO J un2fang, ZHOU Sheng2bao
( Co llege of M a them a tic s and Comp u te r Sc ience, Shanxi D a tong U n ive rsity, D a tong 037009 , Ch ina)
A b stra c t: In o rde r to we ll re so lve the h igh ly skewed c la ss d istribu tion be tween chu rn s and no2chu rn s, the cu stom e rs chu rn p red ic2
tion mode l is rea lized acco rd ing to the CR ISP2DM ( C ro ss2indu stry Standa rd P roce ss fo r D a ta M in ing) fram ewo rk. The m u lti2c la s2
sifie r c la ss2com b ine r app roach is adop ted. The mode l cou ld no t re su lt in a‘nu ll’p red ic tion system tha t simp ly p red ic ts a ll in2
stance s a s non2chu rne rs. Comp a red w ith a single c la ssifie r, the accu racy and gene ra liza tion of the mode l a re imp roved.
Key word s: cu stom e rs chu rn p red ic tion; dec ision tree; m u lti2c la ssifie r c la ss2com b ine r; da ta m in ing
0 引
言
1 建模步骤
模型按照 数据 挖 掘的 行业 标 准 CR ISP2DM [ 5 ] 逐 步建立 。挖掘过程分为商业理解 、数据理解 、数据准 备 、建立模型 、评估模型 、发布模型等 6 个子过程 ,这
6个子过 程 可 以 反 复 迭 代 , 直 至 达 到 商 业 理 解 的 要 求 。图 1 为本模型数据理解和准备的流程图 。
随着行业竞争的加剧 ,客户频繁流失给电信业 、
银行业 、保险业等公司的效益和营销管理带来了很大 的影响 。怎样尽早发现有流失倾向的客户 ,客户为什
么要流失 ,以及怎样成功挽留客户是公司需要解决的 问题 [ 1 ] 。 Ga rtne r公司调查数据表明 , 开发一个新 客
户的费用是维持一个老客户的 4~5倍 [ 2 ] 。
用数据挖掘方法建立客户流失预测模型就是对 客户基本自然属性与历史行为属性的数据进行深入
分析 ,抽取出客户流失属性特征后用一定的挖掘算法
建立客户流失预测模型 ,从而预测在网客户未来一段 时间内流失可能性以及流失原因 ,为客服部门进行客
2 多基决策树联合决策算法
2. 1 算法思想
数据整理 好 后 , 按比 例抽 样形 成 训练 集 和 测 试 集 ,用训练集训练模型 , 用测试集
您可能关注的文档
- 基于LBS位置服务的隐私保护算法研究.doc
- 基于LCM与字库芯片的中英文字符显示技术.doc
- 基于LHA密写的信息隐藏技术设计.doc
- 基于Leavitt模型的软件本地化项目风险管理研究.doc
- 基于Logistic增长曲线模型的大学在校学生数量发展预测.doc
- 基于Logistic回归分析的高校财务风险预警研究.docx
- 基于Mapreduce的大规模社会网络提取方法研究.doc
- 基于MapReduce的粒子群投影寻踪模型的设计与实现.doc
- 基于MatlabSimulink和GUI的运动控制系统虚拟实验平台设计.doc
- 基于Malmquist生产力指数的我国民用机场运营效率分析.doc
- 第六章《第一节 位置和范围》教学设计2023-2024学年人教版七年级地理下册.docx
- 1.3.1物质的分散系 胶体 教学设计 2024-2025学年高一上学期化学苏教版(2019)必修第一册.docx
- 二年级体育上册 我们爱整洁教案.docx
- 高中地理 第五章 环境管理及公众参与 5.3 公众参与教案 新人教版选修6.docx
- 高中英语 Module 3 Interpersonal Relationships—Friendship Section Ⅲ Integrating Skills & Cultural Corner教案 外研版选修6.docx
- 整数、小数实际问题(教学设计)-2023-2024学年人教版数学六年级下册.docx
- 一年级道德与法治下册 第一单元 今天吃什么 第3课《小心,病从口入》教案4 教科版.docx
- 高中历史 第2课 中国古代的土地制度教案 岳麓版必修2.docx
- 江苏省徐州市铜山区七年级地理上册 4.2气温和降水(降水和降水的分布)教案 (新版)湘教版.docx
- 四年级品德与社会下册 从看电视说起教案 人教新课标版.docx
文档评论(0)