数据仓库建模方法论课件.pptVIP

  • 45
  • 0
  • 约1.03万字
  • 约 47页
  • 2016-04-07 发布于湖北
  • 举报
影响数据仓库粒度级别的主要因素 汇总数据 汇总数据能够改善数据交付处理性能,汇总数据不会节省存储空间,因为创建汇总的细节可能会继续被保留。汇总提供的好处主要包括: 在线存储需求减少 分析的标准化以及数据交付性能的改善 合并实体通过减少连接操作的数量,提高了数据交付处理的性能,并且可以增强一致性。 分离数据 根据稳定性和用法来分离数据。稳定性分析根据各个数据属性是否经常变化的特性将这些属性进行分组。 影响因素 描述 当前业务需求 粒度级别必须足以回答定位在该数据仓库迭代范围内的每一个业务问题。提供高的粒度级别增加了数据仓库和项目的开发成本,如果业务不需要细节,则增加的成本就没有商业价值。 未来业务需求 按照目前明确需求建立数据仓库,但在建立并抽取数据时要适应考虑未来的需求 数据挖掘需求 数据挖掘算法需要细节级明细数据 派生数据需求 派生数据在计算时使用了其它的数据元素,除非在代价和开发时间方面有很大增长,否则所选的粒度级别应该适用于存储所有用于派生其它数据元素的元素。 操作系统粒度 操作源系统中有效的细节级别,对于不同粒度的源系统需要决定是否在最低的公共级别上抽取数据,以使所有的数据很好的整合,或者从每一个系统中根据他的有效粒度来抽取数据。 存储开销 粒度级别对存储开销有很大影响 备份和恢复 数据仓库需要周期性地进行备份和恢复,细节越多,日常备份需要的时间也越多。 数据仓库粒度

文档评论(0)

1亿VIP精品文档

相关文档