商务数据挖掘与应用案例分析-全套PPT课件.pptxVIP

商务数据挖掘与应用案例分析-全套PPT课件.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商务数据挖掘与应用案例分析-全套PPT课件.pptx

商务数据挖掘与应用案例分析;第1章绪论;1.1引例;超市货架组织;广告精准投放;客户流失分析;;免费用户到付费用户的转化;1.2数据挖掘产生的背景及概念;1.2.1数据挖掘产生的背景;案例1-1:梅隆银行的数据挖掘;案例1-2:Yahoo!数据挖掘案例;1.2.2数据挖掘概念;1.3数据挖掘任务及过程;1.3.1数据挖掘任务(1);1.3.1数据挖掘任务(2);1.3.1数据挖掘任务(3);1.3.1数据挖掘任务(4);;;;商用软件(1);商用软件(2);商用软件(3);开源软件(1);开源软件(2);1.5数据挖掘在商业领域中的应用(1);1.5数据挖掘在商业领域中的应用(2);1.5数据挖掘在商业领域中的应用(3);1.5数据挖掘在商业领域中的应用(4);1.5数据挖掘在商业领域中的应用(5);1.5.1市场营销;1.5.2交叉销售与交叉营销;1.5.3客户关系管理;1.5.4个性化推荐与个性化服务;1.5.5风险分析与控制;1.5.6欺诈行为检测和异常模式的发现;1.5.7供应链库存管理中的需求预测;1.5.8人力资源管理;1.6数据挖掘技术的前景(1);;阅读资料;作业P17:1.1,1.2,1.3,1.4,1.5;商务数据挖掘与应用案例分析;第2章数据挖掘建模方法;2.1概述(1);2.1概述(2);商业数据挖掘案例;2.2业务理解;2.3数据理解(1);2.3数据理解(2);2.3数据理解(3);2.4数据准备(1);(1)数据筛选

数据筛选的任务是确定数据挖掘分析过程中所必须的数据,即选择有用的特征和记录。

在选择数据的时候,首先要考虑的问题是数据要符合解决企业问题的需要。

再者,由于用于建模的数据应尽可能地完整,数据量尽可能多。

当开发预测模型时,资料中也应该包括想要的输出。

;(2)数据清洗

数据挖掘过程是否成功,得出的结果模型是否可靠,取决于数据质量的好坏。清理数据的任务恰恰是清理数据中包含的噪声和与数据挖掘主题明显无关的数据,从而提高数据的质量。清理数据通常包括:

填补空缺的数据值。例如忽略有空缺值的记录;人工填写空缺值;使用一个全局变量填写空缺值;使用属性的均值填写空缺值。

清理噪声数据。对于噪声数据有以下几种处理方法:一是分箱,二是聚类方法,通过聚类发现孤立点。三是计算机与人工相结合的方法,四是回归分析,建立回归方程。

解决不一致问题。数据的不一致主要表现在数据的单位、命名、结构、含义不一致。可以通过对数据的统一调整进行解决。;(3)数据构建

数据构建包括建设性的数据准备工作,例如属性构造,多维数据组织(聚集),数据泛化处理。

属性构造是指构造新的属性并添加到属性集中,以帮助提高数据挖掘的过程。

多维数据组织(聚集)是指对数据进行汇总和聚集,采用切片、旋转等操作将原始数据按照多维立体形式组织成为不同层次、不同粒度、不同维度的聚集。

数据泛化处理是指使用高层次的概念替换低层次的概念。例如短信业务替换各种不同种类的短信业务,使用国家替换城市。

;(4)数据整合

数据整合的主要任务是将来自多数据源(例如数据库、文件等)的相关数据组合到一起,即把不同来源、格式、特点性质的数据在逻辑上或者物理上有机地集合在一起,使之更加有利于数据挖掘过程的实现。

(5)数据规范化

规格化数据就是将有关属性数据按比例缩放,使之落入一个特定的小范围内,以消除数值型数据因大小不一而造成的数据挖掘结果的误差。常用的规格化数据方法有三种:

最大最小规格化

z-score规格化

小数定标规格化

;2.4数据准备(6);2.5建模(1);2.5建模(2);

;2.5.1成功建立预测模型的注意要点(2);2.5.1成功建立预测模型的注意要点(3);2.5.2如何建立有效的预测模型(1);2.5.2如何建立有效的预测模型(2);2.5.2如何建立有效的预测模型(3);2.5.2如何建立有效的预测模型(4);2.6评估;2.7部署;无论做什么类型的数据挖掘工作,保持开放的思维特别重要。以下几点值得特别注意。

(1)业务的理解永远是第一位的!数据挖掘的对象是某一专业领域中积累的数据,挖掘的结果最终要应用于该专业。因此数据挖掘的过程离不开应用领域的专业知识。“BusinessFirst,techniquesecond”是数据挖掘应用的特点。

(2)与行业专家沟通。每个行业都有其特殊性,行业专家的指点有助于正确理解业务流程、形成正确的挖掘思路;同时数据挖掘的最好结果是对行业有用又出乎行业人士意料之外的知识,这就需要行业专家加以判断。“验证后的模型(结论)请交给业务人员做第二次

文档评论(0)

扬州牧 + 关注
实名认证
文档贡献者

资料收集自互联网,若有侵权请联系删除,谢谢~

版权声明书
用户编号:8036120077000004

1亿VIP精品文档

相关文档