数据挖掘在数据矿山中挖掘蕴藏的知识金块.pptVIP

数据挖掘在数据矿山中挖掘蕴藏的知识金块.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在数据矿山中挖掘蕴藏的知识金块

数据挖掘 --在数据矿山中挖掘蕴藏的知识金块;*;腾讯鲜为人知的重武器之 --数据挖掘;腾讯鲜为人知的重武器之 --数据挖掘;腾讯鲜为人知的重武器之 --数据挖掘;腾讯鲜为人知的重武器之 --数据挖掘;*;*;*;求贤若渴之 --数据挖掘;求贤若渴之 --数据挖掘;求贤若渴之 --数据挖掘;*;时代背景; 一个中等规模的企业每天要生产100MB以上来自各生产经营等多方面的商业数据; 在科研方面,以美国宇航局的数据库为例,每天从卫星下载的数据量就达3~4TB之多,而为研究,这些数据至少要保持7年之久; 《纽约时报》由60年代的10-20版扩张至现在的100-200版,最高曾达1572版;《北京青年报》也已是16-40版,等。而在现实社会中,人均日阅读时间通常为30-45分钟,只能浏览一份24版的报纸。 据估计,1993年全球数据存储容量约为二千TB,到2000年增加到三百万TB,面对极度膨胀的数据信息量,人们受到“数据过剩”的巨大压力。;*;*;*;*;(一)数据仓库与OLAP;1.1 为什么要建立数据仓库?;*;*;*;数据仓库的关键特征;*;*;*;*;1.2 数据仓库模型?;*;*;*;*;*;*;*;*;星型模型示例;*;*;*;*;1.3 OLAP技术;*;OLAP的分析方法;*;*;*;*;*;*;*;(二)数据挖掘;2.1 为什么要进行数据挖掘?;实际需求的驱动;*;2.2 什么是数据挖掘?;*;数据挖掘的概念;2.3 常用的数据挖掘技术?;常用的数据挖掘技术;(1)分类;*;*;*;(2)聚类分析;*;*;*;(3)关联分析;(3)关联分析;(3)关联分析;*;(4)孤立点分析;(4)孤立点分析;2.3 数据挖掘的典型应用?;1)哪些商品放在一起会比较好卖;2)库存预测;3)股票预测;4)NBA教练的布阵;4)NBA教练的布阵;5)出了一个新成品,哪些老客户最可能购买;5)出了一个新成品,哪些老客户最可能购买;6)登录网站的当前用户现在最可能购买什么东西?;6)登录网站的当前用户现在最可能购买什么东西?;*;2.4 几个关系?;(1) DW与DM的关系?; 数据仓库:是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。 数据挖掘:研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。;*;*;2. OLAP与DM?; OLAP:假设验证。比如,一个分析师想找到什么原因导致了贷款拖欠,他可能先做一个初始的假定,认为低收入的人信用度也低,然后用OLAP来验证他这个假设。 DM:自动学习。比如,一个用数据挖掘工具的分析师想找到引起贷款拖欠的风险因素。数据挖掘工具可能帮他找到高负债和低收入是引起这个问题的因素,甚至还可能发现一些分析师从来没有想过或试过的其他因素,比如年龄。;*;*

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档