08数据挖掘最终版.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
08数据挖掘最终版要点

客户关系管理 8.2.2 8.2.3 8.2.4 数据挖掘 的基本步骤 8.2.1 8.2.4 数据挖掘的基本步骤 客户关系管理 8.2.4 数据挖掘的基本步骤 8.2.4.1 数据挖掘的一般过程 数据 转换 数据 模式 预处理 数据 目标 数据 知识 选择 预处理 评价模式 数据挖掘 转换 数据处理 数据挖掘 结果评价 客户关系管理 8.2.4.1 数据挖掘的一般过程(续) 数据挖掘一般可以分为4个阶段: 1、确定目标 2、数据准备 3、实施数据挖掘 4、结果的解释与评估 客户关系管理 8.2.4 数据挖掘的基本步骤 8.2.4.2数据挖掘过程模型 一般情况,数据挖掘项目要经历的过程包括:问题和数据的理解、收集和准备,建立数据挖掘模型,评价所建的模型和应用所建的模型等一系列任务。 客户关系管理 8.2.4.3实施数据挖掘的人员配备 数据挖掘过程分步实现,不同的步骤需要不同专长的人员,大体可以分为几类: 1. 业务分析人员 2. 数据分析人员 3. 领域专家 4. 决策制定人员 5. 数据管理人员 客户关系管理 8.2.4.4 实施数据挖掘的关键问题 1、用数据挖掘解决什么样的商业问题 项目的需求范围通常都难以确定,这是所有应用系统共有的实施风险。由于数据挖掘项目投入巨大,与需求关联极强,这种风险在数据挖掘项目中表现的尤为明显,必须按照软件工程的方法进行开发,做到需求描述清楚、理解正确才能使项目有基本保证,盲目的数据挖掘很难成功。 2、为进行数据挖掘所做的数据准备 其实数据挖掘最后成功与失败,是否有经济效益,数据准备起到了至关重要的作用。数据准备包含很多方面:一是从多种数据源去综合数据挖掘所需要的数据,保证数据的综合性、易用性、数据的质量和数据的时效性,这有可能要用到数据仓库的思想和技术;另一方面就是如何从现有数据中衍生出所需要的指标,这主要取决于数据挖掘者的分析经验和工具的方便性。 3、数据挖掘的各种分析算法 数据挖掘的分析算法主要来自于以下两个方面:统计分析和人工智能(机器学习、模式识别等)。另外需要强调的是,任何一种数据挖掘的算法,不管是统计分析方法、神经元网络、各种树分析方法,还是遗传算法,没有一种算法是万能的。不同的商业问题,需要用不同的方法去解决。 客户关系管理 第3节 数据挖掘的功能与方法 数据挖掘的功能 8.3.1 数据挖掘的方法 8.3.2 客户关系管理 8.3.1 数据挖掘 的功能 8.3.2 8.3.1 数据挖掘的功能 客户关系管理 8.3.1 数据挖掘的功能 数据挖掘功能用于指定数据挖掘任务要找的模式类型。一般而言,数据挖掘任务可以分两类:描述和预测。 描述性挖掘任务描述数据库中数据的一般性质。 预测性挖掘任务对当前数据进行推断,以做出预测。 客户关系管理 8.3.2 数据挖掘的方法 8.3.2.1 决策树 数据挖掘的决策树方法以信息论原理为基础,是目前最有效且应用最广泛的方法。 决策树是一种预测模型,可以把它看作一棵树。其中的每一个分支都是分类问题,树叶就是在具体的类别下的数据集合的子集。 客户关系管理 8.3.2.1 决策树 决策树具有以下特征(以移动电话行业为例,见图8.3.3): (1)它在每一个分支点不会丢失任何数据(一个给定的父结点的记录数目总是等于它所包含的两个子结点的记录数目之和)。 (2)终止合同的客户数目与未终止合同的客户数目总是一定的。 (3)建立模型的过程非常容易理解(与神经元网络和标准的统计技术相比)。 (4)决策树模型能有效地找出有可能终止合同的客户,并开展有针对性的营销活动。 (5)可以用决策树模型建立起对客户的直觉。 客户关系管理 8.3.2.1 决策树(续) 图8.3.3 决策树结构示意图 客户关系管理 8.3.2.1 决策树(续) 决策树方法被广泛地用于商业研究和预测过程中,如信用卡客户流失预测、不同国家货币间的汇率变化的时间序列分析预测。当然,决策树也有许多不适用的领域,其中有很多简单的问题用线性回归分析更有效。 决策树更适合于建立的模型和分析过程都是比较复杂的实际问题,主要有: 1、商业开发 2、数据预处理 3、预测 客户关系管理 . 8.3.2. 2粗糙集 概念最早是由Z.Pawlak于1982 年提出。 最早被用于医学和工业知识库中。近年来,研究取得了很快发展,涉及领域很广。 理论的出发点:根据目前已有的对给定问题的知识将问题的论域进行划分,然后对划分后的每一个组成部分确定其对某一概念的支持程度。 基本思想:将数据库中的属性分为条件属性和结论属性,对数据库中的

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档