3基于特征选择的分类器集成模型.doc

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3基于特征选择的分类器集成模型

本科生毕业论文(设计) 题 目 基于代价敏感学习的客户流失预测模型研究 学 院 工商管理学院 专 业 管理科学 学生姓名 沈冰洁 学 号 0844021034 年级 08级 指导教师 肖进 基于代价敏感的客户流失率预测模型研究 专业:管理科学 学生:沈冰洁 指导老师:肖进 摘 要 随着竞争日渐激烈,企业的同类化和产品的同质化都日趋严重,客户分流的现象日趋明显,最直接的影响就是客户流失率的大幅攀升,如何将客户流失率控制在一个稳定的范围内,成为企业关注的一个热点话题。 过去已有多种分类模型对客户流失率进行预测,这些传统的分类模型均基于分类精度,即目标函数为分类精度最小化,忽略了分类代价不一致这一因素,因此造成很大分类代价,为了解决这一问题,本文在已有模型的算法和基础上进行改进,通过引入误分代价因子,从而使模型代价敏感,代价敏感模型不再仅仅基于分类精度最优,同时也是分类代价最低。 完成模型的改进后,结合实例数据样本,对BP神经网络和代价敏感BP神经网络以及支持向量机(SVM)的分类结果进行了对比,实验结果表明,引入误分代价因子之后,模型的分类精度得到了有效提高。 关键词:代价敏感 客户流失率预测 BP神经网络 MATLAB 数据挖掘 绪论 1.1选题目的及意义 客户关系管理(Customer Relationship Management, CRM)已经被先进企业所关注,所谓以民为本的思想不仅在治国上是上策,同样适用于企业的企业文化和企业凝聚力的构建,因此,在这个竞争激烈的时代,以客户为中心的经营理念已经成为企业获得优良可持续竞争力的一个重要手段。Jones 和 Sasser 对9个行业的客户保持情况进行了调查: 客户保持率每增加5%,行业平均利润增加幅度在25% ~ 85% 之间。Bhattacharya 调查指出,发展一个新客户是保留一个老客户所花费代价的5 ~ 6倍,而保持现有客户比获取新客户一般可节约代价4 ~ 6倍,减少客户流失对企业利润有着惊人的影响[1]。 近年来,在客户流失率预测上,在数据挖掘这一板块的研究越来越得到广大学者的重视,随着竞争的不断白热化,单是注重实体产品的服务和本身质量提升已经不能满足这个同质化严重的产品市场,因此最优秀的企业通常是以出售产品附加价值为主导方向,而区别于产品的核心价值,附加价值最终受益和讨好的对象是客户,客户满意度直接关系到企业的市场份额的占有以及是否有实力长期占有。同样,除了盈利之外,降低成本或者说是成本控制也是企业利益最大化的一个必要手段,面对同质产品的竞争企业,在规模、地域均差别不大的情况下,产品本身成本也是相差无几的,这样一来,一些隐性成本将成为影响利润的关键因素,其中客户流失率引发的成本是一个占比较大的影响因素,因此,对于目前企业来说,对于客户流失率都十分的重视。 由此可见客户流失对企业来说损失是非常大的,由此也引起了国内外的研究者的兴趣,在众多的研究手段中有一种是基于数据挖掘,对潜在客户流失进行预测,便于对企业今后的战略发展做出一定的指导和方向性建议。 这类研究主要是利用数据挖掘,对现有数据进行分类,得到客户的流失倾向,目前常见的分类方法有支持向量机(Support Vector Machine, SVM)、人工神经网络(Artificial Neural Network, ANN)、决策树(Decision Tree, DT)、Logistic回归(Logistic Regression)和贝叶斯网络(Bayesian Network, BN)等,并且今年来这些分类器均在电信行业、电子商务、银行信用卡业务和人寿保险纠纷上应用广泛,其成效也是较为优秀可观的。但是任何一种方法总是有缺陷的,对于以上几种分类器来说,对于其不能对不同代价产生敏感反应这一缺陷,如今是研究的热门,本文即针对这一热点讨论问题。 对于不同客户代价,我们在对其进行挽留的过程中所要付出的成本是不同的,在此基础上以往的分类器模型就不再使用了,以往的分类模型最终均为基于模型运行的精度,即分类的准确性将是评价模型优劣的一个标准,但是在实际案例中,数据往往存在一个不平衡的问题,分类准确性不再是评价一个模型的最好标准,因此,本文中引入代价敏

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档