数据仓库架构及模型设计基础.docxVIP

  • 28
  • 0
  • 约7.96千字
  • 约 23页
  • 2022-03-20 发布于浙江
  • 举报
? ? 数据仓库架构及模型设计基础 ? ? 本博客已迁移至微信公众号!将不再更新 关注公众号即可获得免费学习资源,获得免费指导!!! 公众号后续将会持续更新clickhouse,sparkstreaming,flink,数仓建模,用户画像,实时计算,推荐系统,实时数仓等内容,感兴趣的朋友可以关注 不定期会有朋友的面经分享 ? ? 注:本文所有内容摘自《Hadoop构建数据仓库实践》 1.数仓架构 1.1数据集市架构 数据集市是按主题域组织的数据集合,用于支持部门级的决策。有两种类型的数据集市:独立数据集市和从属数据集市。 独立数据集市集中于部门所关心的单一主题域,数据以部门为基础部署,无须考虑企业级别的信息共享与集成。例如,制造部门、人力资源部门和其他部门都各自有 他们自己的数据集市。独立数据集市从一个主题域或一个部门的多个事务系统获取数据,用以支持特定部门的业务分析需要。一个独立数据集市的设计既可以使用实体关 系模型,也可以使用多维模型。数据分析或商业智能工具直接从数据集市查询数据,并将查询结果显示给用户。一个典型的独立数据集市架构如图1-2所示。 因为一个部门的业务相对于整个企业要简单,数据量也小得多,所以部门的独立数据集市具有周期短、见效快的特点。如果从企业整体的视角来观察这些数据集市, 你会看到每个部门使用不同的技术,建立不同的ETL的过程,处理不同的事务系统,而在

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档