客户关系管理第3章--数据挖掘.pptVIP

下载本文档

13
0
约5.3千字
约 29页
2018-05-28 发布于河北
举报
版权申诉

客户关系管理第3章--数据挖掘.ppt

1、本文档共29页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

客户关系管理第3章--数据挖掘

学习目标学习目标 3.1.1数据挖掘的定义和内涵从技术的角度来说，数据挖掘（Data Mining）就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 3.1.1数据挖掘的定义和内涵从商业的角度来说，数据挖掘是一种新的商业信息处理技术，其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理，从中提取辅助商业决策的关键性数据。 1)关联分析 2)序列模式分析 3)分类分析 4)聚类分析 1)关联分析关联分析是挖掘表面看似独立的事件间的相互关系。例如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的知识。【业务链接3－1】尿布和啤酒全球最大的零售商沃尔玛（Walmart）通过对顾客购物的数据分析后发现，很多周末购买尿布的顾客也同时购买啤酒。经过深入研究后发现，美国家庭买尿布的多是爸爸。爸爸们下班后要到超市买尿布，同时要“顺手牵羊”带走啤酒，好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近，从而双双促进了尿布和啤酒的销量。这个经典的“尿布和啤酒”的故事被公认是商业领域数据挖掘的诞生。这里就是利用关联分析这种方法，发现两种商品之间有很高的相关系数，引起重视，然后深入分析后才找出内在原因的。 2)序列模式分析它与关联分析相似，其目的也是为了控制挖掘出的数据间的联系。但序列模式分析的侧重点在于分析数据间的前后（因果）关系。可以通过分析客户在购买A商品后，必定（或大部分情况下）随着购买B商品，来发现客户潜在的购买模式。例如，一个顾客在买了电脑之后，就很有可能购买打印机、扫描仪等配件。 3)分类分析分类分析就是通过分析样本客户数据库中的数据，为每个类别作出准确的描述或建立分析模型或挖掘出分类规则，然后用这个分类规则对其它客户的记录进行分类。比如，信用卡公司根据顾客的信用记录，把持卡人分成不同等级，并把等级标记赋与数据库中的每个记录。对于每一等级，找出它们共同点，比如：“年收入在10万元以上，年龄在40～50岁之间的外企白领”总体上信用记录最高。有了这样的挖掘结果，客户服务部门就知道一个新的客户的潜在价值，在客户服务投入上就心中有底。 4)聚类分析这是分类的逆向方法。聚类把没有分类的记录，在不知道应分成几类的情况下，按照数据内在的差异性大小，合理地划分成几类，并确定每个记录所属类别。它采用的分类规则是按统计学的聚类分析方法决定的。比如，面对数据库中“消费额”、“购买频率”、“收入水平”等多个评价指标，没有办法按照一个指标去分类，就可以通过聚类按照数据间的自然联系把分散的记录“聚”成几“堆”，然后再对每堆进行深入分析。 3.1.3数据挖掘的经典算法 1) 神经网络 2)　决策树算法 3）聚类算法 1) 神经网络神经网络被称为有学习能力的商业智能系统，是企业客户关系管理的一项重要支持工具。它具有和人类大脑相似的功能，经过对神经网络系统进行一段时间的训练以后，该系统可以在没有人干预的情况下进行模拟识别，解决特定领域中的问题。 2)　决策树算法决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如，在贷款申请中，要对申请的风险大小做出判断，图5-2是为了解决这个问题而建立的一棵决策树，从中我们可以看到决策树的基本组成部分：决策节点、分支和叶子。【业务链接3－2】贷款决策负责借贷的银行官员利用上面这棵决策树来决定支持哪些贷款和拒绝哪些贷款，那么他就可以用贷款申请表来运行这棵决策树，用决策树来判断风险的大小。“年收入￥40,00”和“高负债”的用户被认为是“高风险”，同时“收入￥40,000”但“工作时间5年”的申请，则被认为“低风险”而建议贷款给他/她。 3）聚类算法聚类方法是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程被称为聚类。由聚类所组成的簇是一组数据对象的集合，这些对象与同一簇中的对象彼此类似，与其他簇中的对象相异。在许多应用中，可以将一些簇中的数据对象作为一个整体来对待。 3.1.4 数据挖掘的过程模型 1) 5A模型 2)　SEMMA模型 1) 5A模型（1）评估（Assess）是指准确评估模型的需求和设计方向。（2）存取（Access）是指挖掘模型能够快速、准确地对数据进行存取。（3）分析（Analyze）是指运用数据挖掘工具或方法对数据进行合理、有效的分析。（4）演示（Act）是指数据挖掘软件能够提供可视化功能，便于算法的演示和用户对算法的理解。（5）自动（Automate）是指数据挖掘的结果应