- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第17章数据仓库与联
第17章数据仓库与联
机分析处理
数据仓库
联机分析处理技术
数据挖掘
实例
在实际应用中:
某个客户:某某酒吧销售某某啤酒的价
格是多少?操作型数据
某个投资商:每个酒吧在过去三个月里
销售所有啤酒的平均价格是多少?分析
型数据
操作型数据 OLTP
传统数据库:
细节的
在存取的时间时是正确的
可更新
性能要求高
事务驱动
面向应用
一次操作的数据量小
支持日常操作
。。。
分析型数据OLAP
综合的,提炼过的
代表过去数据
不经常更新
性能要求宽松
分析驱动
面向分析
一次操作数据量大
支持管理决策
OLTP 实例
简单的,经常被查询到的,涉及数量不多
的元组。
例如:某某酒吧销售某某啤酒的价格是多
少?
OLAP 实例
复杂的查询,涉及大量的数据,可能需
要运行几个小时的查询。
实例:过去一年某条街上酒吧销售的总
量是多少?
查询不一定基于当前的数据库信息,可
以基于前一个月的数据库信息。
数据仓库
目的:构建新的分析处理环境而出现的一种数据
存贮和组织技术。
方法:
数据集成:
1. 拷贝很多数据源到一个数据仓库。
2. 不时更新数据仓库中的数据。
3. 主要用于数据的分析。
数据仓库的特点
数据是面向主题的
数据是集成的
数据是不可实时更新的
数据是随时间变化的
数据仓库的数据组织
数据仓库系统的体系结构
数据仓库的后台工
具
数据仓库服务器
OLAP服务器
前台工具
应用场景
分店进行OLTP.
分店的数据晚上拷贝到中央数据仓库
分析师对数据仓库进行OLAP.
数据仓库数据模型:
Star Schemas 星型模式
星型模式是最常用的数据仓库模型:
1.事实表Fact table : 非常大的,带有各个维度的一
个表。Often “insert-only.”
2. 维表Dimension tables : 小的,关于各个实体详
细的,静态的信息表。
Example: Star Schema
假设我们要基于酒吧数据库管理系统,分析
每个酒吧,每一种啤酒,哪些客户每天的销
售情况:
我们要建立的事实表如下:
Sales(bar, beer, drinker, day, time, price)
Example -- Continued
维表如下:
Bars(bar, addr, license)
Beers(beer, manf)
Drinkers(drinker, addr, phone)
Time dimension is very special
Days(day,week,month,year)
两种属性:维度属性和度量属
性
事实表中的属性分为:
1.维度属性 : 某一个维表中的码
2.度量属性:被分析衡量的属性,通常是数字
值,由各个维度共同来决定
维度属性可以有层次的
Hierarchy on dimension attributes: 可以在不同层次上查看维表的
数据。
E.g. the dimension DateTime can be used to aggregate by hour of day,
date, day of week, month, quarter or year
度量属性
Price 是这个系统中需要衡量的指标。
它是基于不同维度的组合。
例如:价格可以从酒吧,啤酒,喝酒人
和时间共同来决定价格。
数据仓库数据模式:
星型模型和雪花模式 (维表可以有层次)
建立数据仓库的方法
1. ROLAP = “relational OLAP”: 应用关系数
据库来管理多维数据。
2. MOLAP = “multidimensional OLAP”: 用
一个特殊的DBMS (例如:数据立方体)
来实现。
ROLAP 实现技术
1. Bitmap indexes 位图
您可能关注的文档
最近下载
- 2025年秋统编版小学语文六年级上册第七单元考试测试卷及答案.docx
- 泌尿外科利用PDCA循环降低持续膀胱冲洗患者膀胱痉挛的发生率品管圈.pptx VIP
- 设备“三漏”管理制度.docx VIP
- 《重点工业产品用水定额 第14部分:橡胶和塑料制品业重点工业产品》.pdf VIP
- DB11 2075-2022 建筑工程减隔震技术规程.pdf VIP
- 射击学理简介.ppt VIP
- 2023-2024学年辽宁省大连市甘井子区部编版四年级上册期末考试语文试卷【含答案】.pdf VIP
- 2024年沧州幼儿师范高等专科学校招聘笔试真题参考答案详解.docx VIP
- 防腐蚀防泄漏管理制度.docx VIP
- 肥胖对健康的危害与疾病管理题库答案-2025年华医网继续教育.docx VIP
原创力文档


文档评论(0)