数据仓库王开发模型12.pptVIP

  • 2
  • 0
  • 约5.21千字
  • 约 32页
  • 2018-12-29 发布于福建
  • 举报
数据仓库王开发模型12

适当划分粒度的第一步是估算数据仓库中将来使用的数据行数和所需的直接存取存储设备数(DASD)。 在计算出数据仓库所需要占用的存储空间以后,需要根据所需要的存储空间大小确定是否划分粒度,如果需要划分,又应该怎样划分。 2.6 数据仓库的粒度和聚集模型 在数据仓库中确定粒度时,需要考虑这样一些因素:要接受的分析类型、可接受的数据最低粒度、能够存储的数据量。 计划在数据仓库中进行的分析类型将直接影响数据仓库的粒度划分。 数据仓库通常在同一模式中使用多重粒度。 2.6.1 数据粒度的划分 定义数据仓库粒度的另外一个要素是数据仓库可以使用多种存储介质的空间量。 选择合适的粒度是数据仓库设计过程中所要解决的一个复杂的问题,因为粒度的确定实质上是对业务决策分析、硬件、软件和数据仓库使用方法的一个折衷。 还有一种可以大幅降低数据仓库容量的方法,就是只采用概括数据。 2.6.2 数据粒度的级别 数据仓库与数据挖掘技术(第2版) 第二章 数据仓库开发模型 参考课件: /topics/76424/ / 2.1 数据仓库的开发模型 张三 客户 客户与产品 特性 个体 整体 整体间联系 属性 实体 同质实体 异质实体 列(字段、数据项) 记录 表文件 数据库 信用 现实世界是存在于现实之中的各种客观事物。 概念世界是

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档