- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
打印版 第5节 数据仓库的粒度跟聚集
第5章 数据仓库中的粒度及聚集
本章 目标
(1)粒度的估算及划分
(2)粒度的级别
(3)聚集事实表
(4)星座模型
(5)对维度建模的要求
5.1 粗略估算
数据仓库开发者需要解决的最重要的单一设计问
题是数据仓库中的粒度确定。
确定合适的粒度级的起点,是粗略估算数据仓库中
将来的数据行数和所需DASD(直接存取存储设备)数。
毫无疑问,即使在最好的情况下我们也仅能做一下
估计。但在建立数据仓库之初,所需的只是一个数量级
上的估计。
2006-10 weizhidong@ 2
1. 对每一个已知的表:
计算一行所占字节数的
-最大估计值
-最小估计值
对一年内:
空间和
最大行数可能是多少?
行数计算 最小行数可能是多少?
对五年内:
最大行数可能是多少?
最小行数可能是多少?
对表的每个键码:
该键码的大小(按字节)是多少?
一年总的最大空间 最大行大小×一年内最大行数
一年总的最小空间 最小行大小×一年内最小行数
累加索引空间
2. 对所有已知的表重复第1步。
2006-10 weizhidong@ 3
5.2 粒度划分过程的输入
使用空间估计的结果
2006-10 weizhidong@ 4
5.3 双重或单一的粒度?
根据数据仓库环境中将具有的总的行数的大小,设计和
开发必须采取不同的方法。
一年期 五年期
10,000,000 双重粒度级且认 20,000,000 双重粒度级且认
真设计 真设计
1,000,000 双重粒度级 10,000,000 双重粒度级
100,000 认真设计 1,000,000 认真设计
10,000 实际上任何设计 100,000 实际上任何设计
都行 都行
粒度的阈值
2006-10 weizhidong@ 5
5.4 确定粒度的级别
5.4.1 粒度级别确定需反复分析
经验规则:在第一次的设计周期中,如果50%的工作是
正确的,那么整个设计就是成功的。
• 快速建立数据仓库的很小的子集并认真听取用户的反馈意见。
您可能关注的文档
最近下载
- 〖GB50300-2013〗建筑工程施工质量验收统一标准.docx VIP
- 家族企业中的心理契约破坏.pdf VIP
- GB50300-2013建筑工程施工质量验收统一标准.pptx VIP
- 《鉴赏家》课件-【中职专用】高二语文(高教版2023职业模块).pptx
- NB_T 20003.8-2021 核电厂核岛机械设备无损检测 第8部分:泄漏检测.docx VIP
- (完整版)CNC84操作手册.pdf VIP
- NFPA 400-2022 Hazardous Materials Code 危险品守则 危险品守则.pdf
- CAR-T免疫疗法在肿瘤治疗中的应用与进展.pptx VIP
- NFPA 16-2019 泡沫水喷淋器和泡沫水喷雾系统安装标准.pdf VIP
- NFPA 16-2019 泡沫-水喷头和泡沫-水喷雾系统安装标准.pdf VIP
原创力文档


文档评论(0)