- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
灵活有效的数据仓库解决方案:仓库设计和数据建模
20003-17 14:58 作者:IBM
简介 业务环境是在快速变化的,而业务数据的类型也是如此。一个成功的数据仓库解 决方案的基础就是灵活的设计,这种设计可以适应不断变化的业务数据。数据仓 库的架构和仓库数据的建模是仓库设计中的核心过程。
数据仓库的架构
当使用数据模型捕获业务需求时,您就已经完成了数据仓库设计中的部分工 作。然而,正式的数据仓库设计应该从数据仓库的架构开始。
仓库架构是基于一些因素所做的关键决策,这些因素包括当前基础设施、业 务环境、期望的管理和控制结构、实现工作的承诺和范围、企业所采用的技术环 境的功能以及可用的资源等。
架构选择
仓库架构将决定数据仓库和数据集市本身的位置,以及控制所驻留的位置, 或者反之。例如,数据可以驻留在集中进行管理的中心位置中。或者,数据可以 驻留在集中或独立管理的分布式的本地和/或远程位置中。
有以下一些架构选择:
业务范围(Business-wide)的数据仓库
独立的数据集市
互连的数据集市
这些架构选择也可以组合使用。例如,数据仓库架构可以在物理上分布或集 中管理。
业务范围的数据仓库架构
业务范围的数据仓库就是将支持整个或一大部分业务的数据仓库,该业务需 要更加完全集成的数据仓库,跨部门和业务线(line of business)具有较高的数据 访问和使用率。即基于整个业务需求设计和构造仓库。可以将之视作可跨整个企 业使用的决策支持数据的公共存储库,或其中的一个大型子集。这里所使用的术 语:业务范围(business-wide)1仮映的是数据访问和使用的范围,而非物理结构。 在整个企业中,业务范围的数据仓库在物理上可以是集中式的,也可以是分布式 的。
独立的数据集市架构
独立的数据集市架构暗指单独的数据集市,这些数据集市是由特定的工作 组、部门或业务线进行控制的,完全是为满足其需求而构建的。实际上,它们甚 至与其他工作组、部门或业务线中的数据集市没有任何连通性。图1.数据仓库 架构选择
Busi ness and exter nal data sourcesIn dependent Data Marts3| J2 0U220 为 R gIntercon nected Data Marts 丿Business-Wide Dais ehouse
Busi ness and exter nal data sources
In dependent Data Marts
3| J2 0U220 为 R g
Intercon nected Data Marts 丿
Business-Wide Dais ehouse
互连的数据集市架构
互连的数据集市架构基本上是分布式的实现。虽然不同的数据集市是在特定 的工作组、部门或生产线中实现的,但它们可以是集成、互连的,以提供更加全 局的业务范围的数据视图。实际上,在最高的集成层次上,它们可以成为业务范 围的数据仓库。这意味着一个部门屮的终端用户可以访问和使用另一部门屮数据 集市中的数据。您应选择哪种架构?
如果您客户的业务和数据源是相对集中的,那业务范围的集中式数据仓库架 构就是最明智的选择。这实际上对于中间市场的公司而言是很普遍的情况。否则, 对于在地理上广泛分布的业务而言,互连的数据集市和业务范围的分布式数据仓 库就是更加实用的选择。
独立的数据集市架构不是一种好方法,因为它违背了数据仓库的关键概念: 数据集成。
数据仓库的实现方法
实现方法的选择受这些因素的影响:当前的IT基础设施、可用的资源、所 选择的架构、实现的范围、对于跨企业进行的更大业务范围的数据访问的需求、 投资回报率(return-on-investment)需求以及实现的速度。实现方法的选择是数据 仓库设计中的重要部分;该决策需要在数据仓库项目的早期阶段做出。自顶向下 的实现
自顶向下的方法就是在单个项目阶段中实现数据仓库。自顶向下的实现需要 在项目开始时完成更多计划和设计工作。这就需要涉及参与数据仓库实现的每个 工作组、部门或业务线屮的人员。要使用的数据源、安全性、数据结构、数据质 量、数据标准和整个数据模型的有关决策一般需要在真正的实现开始之前就完 成。自底向上的实现
自底向上的实现包含数据仓库的计划和设计,无需等待安置好更大业务范围 的数据仓库设计。这并不意味着不会开发更大业务范围的数据仓库设计;随着初 始数据仓库实现的扩展,将逐渐增加对它的构建。现在,该方法得到了比自顶向 下方法更广泛的接受,因为数据仓库的直接结果可以实现,并可以用作扩展更大 业务范围实现的证明。您应该选择哪种实现?
每种实现方法都有利弊。在许多情况下,最好的方法可能是某两种的组合。 该方法的关键之一就是确定业务范围的架构需要用于支持集成的计划
文档评论(0)