第数据挖掘剖析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学习目标 学习目标 3.1.1数据挖掘的定义和内涵 从技术的角度来说,数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 3.1.1数据挖掘的定义和内涵 从商业的角度来说,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。 1)关联分析 2)序列模式分析 3)分类分析 4)聚类分析 1)关联分析 关联分析是挖掘表面看似独立的事件间的相互关系。例如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的知识。 【业务链接3-1】尿布和啤酒 全球最大的零售商沃尔玛(Walmart)通过对顾客购物的数据分析后发现,很多周末购买尿布的顾客也同时购买啤酒。经过深入研究后发现,美国家庭买尿布的多是爸爸。爸爸们下班后要到超市买尿布,同时要“顺手牵羊”带走啤酒,好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近,从而双双促进了尿布和啤酒的销量。这个经典的“尿布和啤酒”的故事被公认是商业领域数据挖掘的诞生。这里就是利用关联分析这种方法,发现两种商品之间有很高的相关系数,引起重视,然后深入分析后才找出内在原因的。 2)序列模式分析 它与关联分析相似,其目的也是为了控制挖掘出的数据间的联系。但序列模式分析的侧重点在于分析数据间的前后(因果)关系。可以通过分析客户在购买A商品后,必定(或大部分情况下)随着购买B商品,来发现客户潜在的购买模式。例如,一个顾客在买了电脑之后,就很有可能购买打印机、扫描仪等配件。 3)分类分析 分类分析就是通过分析样本客户数据库中的数据,为每个类别作出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它客户的记录进行分类。 比如,信用卡公司根据顾客的信用记录,把持卡人分成不同等级,并把等级标记赋与数据库中的每个记录。对于每一等级,找出它们共同点,比如:“年收入在10万元以上,年龄在40~50岁之间的外企白领”总体上信用记录最高。有了这样的挖掘结果,客户服务部门就知道一个新的客户的潜在价值,在客户服务投入上就心中有底。 4)聚类分析 这是分类的逆向方法。聚类把没有分类的记录,在不知道应分成几类的情况下,按照数据内在的差异性大小,合理地划分成几类,并确定每个记录所属类别。它采用的分类规则是按统计学的聚类分析方法决定的。比如,面对数据库中“消费额”、“购买频率”、“收入水平”等多个评价指标,没有办法按照一个指标去分类,就可以通过聚类按照数据间的自然联系把分散的记录“聚”成几“堆”,然后再对每堆进行深入分析。 3.1.3数据挖掘的经典算法 1) 神经网络 2) 决策树算法 1) 神经网络 神经网络被称为有学习能力的商业智能系统,是企业客户关系管理的一项重要支持工具。它具有和人类大脑相似的功能,经过对神经网络系统进行一段时间的训练以后,该系统可以在没有人干预的情况下进行模拟识别,解决特定领域中的问题。 2) 决策树算法 决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如,在贷款申请中,要对申请的风险大小做出判断,图5-2是为了解决这个问题而建立的一棵决策树,从中我们可以看到决策树的基本组成部分:决策节点、分支和叶子。 【业务链接3-2】贷款决策 负责借贷的银行官员利用上面这棵决策树来决定支持哪些贷款和拒绝哪些贷款,那么他就可以用贷款申请表来运行这棵决策树,用决策树来判断风险的大小。“年收入¥40,00”和“高负债”的用户被认为是“高风险”,同时“收入¥40,000”但“工作时间5年”的申请,则被认为“低风险”而建议贷款给他/她。 3.1.4数据挖掘的基本步骤 1)定义商业问题 2)建立数据挖掘库 (1)数据收集; (2)数据描述; (3)选择; (4)数据质量评估和数据清理; (5)合并与整合; (6)构建元数据; (7)加载数据挖掘库; (8)维护数据挖掘库。 3.1.4数据挖掘的基本步骤 3)分析数据 4)准备数据 (1)选择变量 (2)选择记录 (3)创建新变量 (4)转换变量 5)建立模型 3.1.4数据挖掘的基本步骤 6)评价和解释 (1)模型的准确性 (2)模型的可理解性 (3)模型的性能 7) 实施 3.2.1 数据挖掘在CRM中的应用 1)客户群体分类分析 2)客户识别和保留分析 (1)在CRM中,首先应识别潜在客户,然后将他们转化为客户。 (2)在客户保留中的应用 3)对客户忠诚度进行分析 4)客户盈利能力分析 5)交叉销售和

文档评论(0)

四娘 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档