数据仓库架构以及多维数据模型的设计.docxVIP

  • 11
  • 0
  • 约1.03万字
  • 约 29页
  • 2022-03-20 发布于浙江
  • 举报

数据仓库架构以及多维数据模型的设计.docx

? ? 数据仓库架构以及多维数据模型的设计 ? ? 作者 |?云祁 封图| 下载于视觉中国 一、前言 作者最近看了《Hadoop构建数据仓库实践》这本书,收获很多,把一些关于数仓实践的心得整理出来,方便大家共同学习。 二、数据仓库的定义 数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用使用。 三、数据仓库的特点 面向主题的:数据仓库都是基于某个明确的主题,仅需要与该主题相关的数据,其他的无关细节将会被去掉。 集成的:数据仓库里面的数据都是经过ETL( Extract-Transform-Load 抽取-转换-加载)操作后被集中放到同一个数据源,数据仓库里的数据是来自于各种不同的数据源。 随时间变化的:关键数据隐式或者显示地随时间变化而变化。 数据相对稳定的:数据装入后一般只是进行查询操作,没有传统数据库的增删改操作。 总结:数据仓库就是整合多个数据源的历史数据进行细粒度的、多维的分析,可以有效地帮助高层管理者或者业务分析人员做出商业战略决策或商业报表。 四、数据仓库的作用 可以整合公司的所有业务,建立统一的数据中心。 分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果。 可以作为各个业务的数据源,形成业务数据

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档