打印版 第5节 数据仓库的粒度跟聚集.pdfVIP

打印版 第5节 数据仓库的粒度跟聚集.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
打印版 第5节 数据仓库的粒度跟聚集

第5章 数据仓库中的粒度及聚集 本章 目标 (1)粒度的估算及划分 (2)粒度的级别 (3)聚集事实表 (4)星座模型 (5)对维度建模的要求 5.1 粗略估算 数据仓库开发者需要解决的最重要的单一设计问 题是数据仓库中的粒度确定。 确定合适的粒度级的起点,是粗略估算数据仓库中 将来的数据行数和所需DASD(直接存取存储设备)数。 毫无疑问,即使在最好的情况下我们也仅能做一下 估计。但在建立数据仓库之初,所需的只是一个数量级 上的估计。 2006-10 weizhidong@ 2 1. 对每一个已知的表: 计算一行所占字节数的 -最大估计值 -最小估计值 对一年内: 空间和 最大行数可能是多少? 行数计算 最小行数可能是多少? 对五年内: 最大行数可能是多少? 最小行数可能是多少? 对表的每个键码: 该键码的大小(按字节)是多少? 一年总的最大空间 最大行大小×一年内最大行数 一年总的最小空间 最小行大小×一年内最小行数 累加索引空间 2. 对所有已知的表重复第1步。 2006-10 weizhidong@ 3 5.2 粒度划分过程的输入 使用空间估计的结果 2006-10 weizhidong@ 4 5.3 双重或单一的粒度? 根据数据仓库环境中将具有的总的行数的大小,设计和 开发必须采取不同的方法。 一年期 五年期 10,000,000 双重粒度级且认 20,000,000 双重粒度级且认 真设计 真设计 1,000,000 双重粒度级 10,000,000 双重粒度级 100,000 认真设计 1,000,000 认真设计 10,000 实际上任何设计 100,000 实际上任何设计 都行 都行 粒度的阈值 2006-10 weizhidong@ 5 5.4 确定粒度的级别 5.4.1 粒度级别确定需反复分析 经验规则:在第一次的设计周期中,如果50%的工作是 正确的,那么整个设计就是成功的。 • 快速建立数据仓库的很小的子集并认真听取用户的反馈意见。

文档评论(0)

karin + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档