第十一章-数据挖掘.pptVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章-数据挖掘

第十一章 数据挖掘 本章结构 11.1数据挖掘的基本概念? 11.2数据挖掘算法 11.3数据挖掘实施方法 11.4 CRM中数据挖掘的基本应用 11.1数据挖掘的基本概念 11.1.1数据挖掘定义 数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、 模糊的、随机的实际应用数据中提取人们感兴趣的知识,这些知识是隐 含的、事先未知的、潜在有用的信息 数据挖掘是一个交叉学科,它涉及了多个学科的思想和方法,比 如数据库系统、数理统计学、人工智能、可视化和信息科学 11.1.2数据挖掘的数据来源 11.1.3数据挖掘技术 数据挖掘的技术基础是人工智能。人工智能是以自动机为手 段,通过模拟人类宏观外显的思维行为,从而高效率的解决事实世 界问题的科学和技术。但是数据挖掘仅仅利用了人工智能中一些已 经成熟的算法和技术: ? 11.1.4数据挖掘的应用 数据挖掘在生物医学中的应用 数据挖掘在电信业中的应用 数据挖掘在金融业的应用 ? 11.2.1关联分析(association analysis) 要了解关联规则挖掘首先要了解两个概念,即支持度和置信度 支持度 置信度 同时满足最小支持度和最小置信度的规则称为强规则。关联规则挖掘 就是寻找强规则的过程 Apriori算法是一个关于单维、单层、布尔规则的方法。因此它也 是关联规则挖掘中形式最简单的方法 我们用一个简单实例介绍Apriori算法的实现方法 根据表11-1中的事务数据进行Apriori算法,过程如下图所示 最终得到一个频繁项集{ A,B,D}。这就是用Apriori算法寻找频繁项集的过程。 11.2.5孤立点分析 孤立点又叫噪声,是数据库中与数据的一般模式不一致的数据对象 孤立点分析主要包括了基于统计的孤立点检测、基于距离的孤立点 检测等多种方法 ? 11.2.6复杂类型数据分析方法 空间数据挖掘是针对空间数据库进行的数据挖掘。空间数据库中存储 了大量与空间有关的数据,比如地图、医学图像等 多媒体数据库中的存储对象是多媒体对象,如音频数据、视频数 据、图像数据等。多媒体数据库挖掘主要是对图像数据的挖掘 文本挖掘技术可对文本文档进行内容总结、关联分析、分类和 聚类分析等。文本挖掘可以用于文档管理、邮件管理、市场研究、 信息收集等许多方面 11.3数据挖掘实施方法 11.3.1数据挖掘过程模型 11.3.2数据挖掘的基本步骤 这是数据挖掘的第一步,确定分析和预测的目标相当于需求分 析,主要是明确业务目标 分析数据即对数据挖掘库中的数据进行分析,比如计算数据的平 均值、标准差等统计信息,以便发现数据的分布 建立模型是根据模型分析目标选择合适的方法和算法对数据进行 分析,得到一个数据挖掘模型的过程 为了验证模型的有效性,选择最优的模型,一般会将数据集分 为两部分,一部分用于建立模型,另一部分则用于测试模型 对模型的评估主要需要考虑以下几个方面: 11.4 CRM中数据挖掘的基本应用 11.4.1数据挖掘在客户分类中的应用 客户分类是指将所有客户分成不同的类的过程。对客户进行分类有 利于针对不同类型的客户进行客户分析,分别制定客户服务策略 11.4.2数据挖掘在客户识别和客户保留中的应用 (1)数据挖掘在客户识别中的应 识别客户是企业发现潜在客户、获取新客户的过程 (2) 数据挖掘在客户保留中的应用 客户识别是获取新客户,而客户保留则是留住老客户、防止客户 流失的过程 11.4.3数据挖掘在客户忠诚度分析中的应用 客户忠诚度的提高是企业客户关系管理的一个重要目标。数据挖掘 在客户忠诚度分析中主要是对客户持久性、牢固性和稳定性进行分析 ? 11.4.4数据挖掘在客户盈利率分析中的应用 客户盈利率是一个定量评价客户价值的指标。客户盈利率的计算并 不需要数据挖掘。而数据挖掘技术在客户盈利率分析中的应用主要体现 在“分析” 11.4.5数据挖掘在个性化营销中的应用 个性化营销是面向客户的营销,也是客户关系管理的重要组成部 分

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档