数据挖掘文献学习指南.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘在客户流失管理中的应用 文献简介及选择理由 Data Mining Applications in Customer Churn Management 是一篇关于数据挖掘在顾客关系管理(客户流失管理)中的应用的文献综述,主要涉及各种数据挖掘技术和各种技术应用的统计。 客户流失管理是客户管理的核心,基于此研究背景贴近生活,易于理解。文中提到的多种数据挖掘方法模型覆盖面广,拓宽学习面。 文献结构 引言:客户流失管理的重要性 介绍数据挖掘技术,方法分类 统计各种技术应用,研究趋势 结论、后续研究方向 文献主要内容 顾客流失管理的重要性 核心市场策略:保持现有客户防止客户流失 获得一个新客户的费用是留住一个客户费用的5-10倍 在很多产业客户粘性增加5%即会带来25%-95%的净利润增加 研究背景及现状 关于数据挖掘在客户流失管理的应用的文献综述很少 现有文献,E.W.T. Ngai, Li Xiu and D.C.K. Chau, “Application of data mining techniques in customer relationship management: A Literature review and classification,”是对82篇文章的文献综述,从客户关系维度(客户识别、客户吸引、留住和发展客户)和数据挖掘分类(联合、分类、聚类、预测、回归分析、序列分析、可视化)进行研究。 欠缺:研究重点为客户粘性、客户流失管理,没有涉及具体的数据挖掘方法,分类不明确。 文献主要内容 本文从数据挖掘方法出发对32篇文献进行分类,统计,研究趋势,填充了客户流失管理技术方法的空白 数据挖掘方法基本定义: ﹡神经网络或称作连接模型(ConnectionistModel) 它是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。 数据挖掘方法基本定义 决策树(Decision Trees)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果。 回归分析(Logistic Regression)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。 随机森林(Random Forests)是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。可以产生高准确度的分类器,处理大量的输入变量。 数据挖掘方法基本定义 支持向量机方法(Support Vector Machine)是分类的一个机器学习的过程。这是一种建立在统计学习理论的VC 维理论(对一个指标函数集,如果存在h个样本能够被函数集中的函数按所有可能的2h种形式分开,则称函数集能够把h个样本打散;函数集的VC维就是它能打散的最大样本数目h。)和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力 。 数据挖掘技术角度(Data Mining Perspective) 对近期(03-09年)的32篇reference文献根据所采用的技术方法进行分类,分类如表一table1 对使用最多的前三种方法:神经网络(Neural Networks )、决策树(Decision Trees)、回归分析(Logistic Regression)学习,作简要介绍。 根据数据挖掘方法对32篇文献进行分类 表一 给出各方法的使用频数,对于使用最多的前九种方法,选择在较符合各种指标的文献(表中黑体文献),作出简要解释。 数据挖掘方法 神经网络(Neural Networks ) 【17】P. C. Pendharkar, “Genetic algorithm based neural network approaches for predicting churn in cellular wireless network services,”使用遗传算法优化网络权重。研究基于移动通信环境,该文使用交叉验证(最大似然法cross-validation method)和精确模拟得出两个功能良好模型。该篇文献采用循环估计的方法,这一方法相对统计方法是一大改进。 数据挖掘方法 决策树(Decision Tree ) 【11】 J. Qi et al., “ADTreesLogit model for customer churn prediction,”根据感受性曲线的单一指标(ROC曲线上各点反映着相同的感受性,它们都是对同一

文档评论(0)

xiaofei2001129 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档