数据仓库结构设计与实施.docxVIP

  • 7
  • 0
  • 约1.83千字
  • 约 14页
  • 2022-03-20 发布于浙江
  • 举报
? ? 数据仓库结构设计与实施-拆书稿 ? ? 拆书稿-数据仓库结构设计与实施 本篇文章内容目录 第一部分:数据仓库总体结构(原书第二章) 1 金字塔结构 2 元数据与模型 3 映像 4 数据仓库三要素 5 多维总计方阵 6 方阵和数据集市的区别 第二部分:数据仓库设计与应用开发(原书第五章) 数据仓库层次结构 数据仓库概念设计 数据仓库逻辑设计 数据仓库物理设计 正文开始 第一部分:数据仓库总体结构(原书第二章) 1 金字塔结构 金字塔从底层向上,体现出强大的收敛与聚合功能,层面越高越能高度地概括更丰富、更有意义的信息;层面越低,数据体量越大,细节程度越高,信息越具体。每个层面相互依托又互相关联。 数据仓库的金字塔结构和层次1 数据仓库的金字塔结构和层次2 数据仓库结构生态图 其中上图中有一个概念叫:过渡区,它为什么存在?并且有什么存在的价值? ① 为什么存在? 提前可以做数据预处理 来自数据源的数据在到达数据仓库之前,需要经过一些中间处理过程,而ETL常常是批量执行,是一些通用任务,无法完成定制化个性统计需求。而在数据源到数据仓库中间建立过渡区,可以针对特定数据进行预处理。例如:过滤空值、过滤多余字段、进行数据类型转换等等。 ② 存在的价值? 第一、数据源和数据仓库进行隔离 第二、过渡区可作为数据接收切面,接纳不同数据源,数据仓库只需要从过度区获取数据。架构清晰

文档评论(0)

1亿VIP精品文档

相关文档