数据仓库中的粒度.pptVIP

  • 27
  • 0
  • 约3.77千字
  • 约 26页
  • 2017-10-04 发布于浙江
  • 举报
数据仓库中的粒度

第四章 数据仓库中的粒度 SZ1516029_李航 摘要: 4.1 粗略估算 4.2 规划过程的输入 4.3 溢出存储器中的数据 4.4 确定粒度级别 4.5 一些反馈循环技巧 4.6 确定力度级别的几个例子 4.7 填充数据集市 4.8 小结 4.1 粗略估算 粒度:粒度是数据仓库中数据单元的细节程度或综合程度的级别。 粒度与细节程度的关系:粒度级别越高,细节程度越低,反之,粒度级别越低,细节程度越高。 粒度细节级别分为:早期细节级,当前细节级,轻度细节级和高度细节级。 确定数据仓库中数据的恰当粒度是数据仓库开发者需要面对的一个重要设计问题。如果数据仓库的粒度确定的合理,设计和实现中的其余方面就可以进行的非常舒畅;相反,如果粒度确定的不合理,就会使得所有方面都难以进行。 粒度的主要问题是使其处于合适的级别,粒度级别既不能太高也不能太低。 粗略的数据估计 确定适当的粒度级别所要做的第一件事就是对数据仓库中将来的数据进行数据行数和所要的DASD(直接存取存储设备)数进行粗略估算。这仅仅是数量级的估计。 图4-1给出了一个计算数据仓库占用空间的方法路径。第一步是确定数据仓库中将要创建的所有表。然后估计每张表的大小,估计一个上届一个下届足矣。 接下来,估计一年内表中可能的最少行数和最多行数。 估计一年内数据仓库中数据单元的数量后,重复用同样方法对五年内的数据进

文档评论(0)

1亿VIP精品文档

相关文档