- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
新圆计算机系统公司
数据仓库
议程:
数据仓库
◆数据库的应用分类和数据仓库的由来
◆数据仓库的特点
◆数据仓库的建立
◆服务器的整合与数据仓库
◆数据挖掘与知识发现
◆数据仓库与数据挖掘
◆数据挖掘的任务和工具
◆国内外主要供应商与产品
数据库的定义
4◆传统的数据库技术是以单一的数据资源为中心
同时进行从事务处理,批处理到决策分析的各类
处理
◆特别是OP主要是为自动化,精简工作任务和
高速数据采集服务的。它的运行是事务驱动,面
向应用的,数据库的根本任务是完成数据操作
即及时安全地将当前事务所产生的记录保存下来
数据仓库的产生
◆随着计算机的全局应用和复杂分析的增加,人们已不满足与简单
的数据操作,用于进行商务运转的大量数据可能是人们不大在意
未加充分利用的东西。近而产生了使用现有的和自己长期积累
生成的数据进行分析和推理,为决策提供依据的需求,从而导致
了DSS和OLAP的产生。
◆人们逐渐认识到计算机系统中存在着两类不同的处理:操作型处
理(事务处理):主要是对一个或一组记录的查询和修改,这时
候人们关心的是响应时间数据的安全性和完整性
◆和分析型处理(信息型处理):用于管理人员的决策分析,如
DDs( decision support system)、EIs、多维分析等
数据仓库的产生和定义
◆随着时间的推移,人们开始对DB中的原始数据
进行再加工,形成一个综合的、面向分析的环
境以支持决策的产生;数据库由操作性环境发
展三种环的比体系化不境,数据仓库则
◆面向主题的、集成的、稳定的、用以支持经营
管理中的决策制定过程的不同时间的数据集合。
用于OLTP的数据库无法满足分
析的需求
◆缺乏组织性:无统一的时间标准,抽取算法和
抽取级别又不相同,参考的外部数据的不同
◆效率低下:操作数据难以转化成有用的信息。
1。各公司个阶段都要积累大量的数据,但他
们仅是一种处于原始状态的资源2为了提高性
能,数据常被分散在各个子系统中,而各个子
系统的应用又是千差万别、零散琐碎。3同时
主题内容可能分散在多个应用中,同一应用在
不同字段中可能存在着同名异义,异名同义、
单位不同和字段不同等矛盾
用于OLTP的数据库无法满足分
析的需求
◆其他困扰着基于传统数据库的DDS问题。
如DDS分析需要较长时间,而OLTP则要
求尽快作出响应;进行一次大规模的分
析,对OLTP的影响是难以忍受的。DDS
常常需通过一端历史时期的数据来进行
分析趋势,而数据库一般只存储短期数
据,且各个领域的保存期限也千差万别,
分析难以满足DDS的需要
为什么要建立数据仓库
痛霅:太多数据,无法作出正确判断!
数据
知识
决定
DATA
KNOWLEDGE
DECISIC NS
财经的 Financial
Patterns
Target Markets
经济的 Economic
a Trends
Funds allocation
政府 Government
Facts
Trading options
销售分数 Point-of
Relations
Where to advertise
Sale
Models
Catalog mailing list
■人口统计学
Associations
a Sales geography
Demographic
equences
生活方式 Lifestyle
建立数据仓库从而获取正确信息
操作性数据
信息性数据
Operational data
n田 iral Data
L OTR1OTR2M
…田田
田-∴田
财务记帐
Account History
面向应用 Application Oriented
■有限的集成 Limited Integration
经常的更新 Constantly Updated
只有当前值 Current Values Only
■支持日常的操作 Supports Day-to-Day
Operations
操作性数据和信息性数据是根本性的不同
数据库的建方一向成功之路
选取数据…获取信息….作出决定
转换
摘取
|6
设计
分发
Distrib
管理和自动操
Manage
Metadata
Automate
仓库Sto
分析发现
Display
Analyze
寻找并理解Fi区函
Discover
and Unde
原创力文档


文档评论(0)