分布式数据仓库讲述.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6.1.2技术分布式数据仓库 图6-14添加服务器来保存数据仓库中数据的进程 6.1.2技术分布式数据仓库 当数据仓库中的处理器扩展到一定数量时,网络上就会出现过量的传输负载。 问题不仅仅出现在一个查询要访问存储在多个服务器管理的数据,而且出现在需要从一台服务器上传输大量的数据。 6.1.3独立开发的分布式数据仓库 数据仓库环境是以一种不协调的方式建立起来的,首先建立某一个数据仓库,然后再独立的建立另一个数据仓库。建立不同数据仓库缺乏协调性的原因通常是政策和机构上的差异,这种情况被称为独立演进的分布式数据仓库。 图6-15多个小组建造数据仓库的四种可能方式,每种均与其他各种不同 6.2开发项目的本质特征 完全无关的数据仓库: 图6-16四个完全独立的业务部门在业务级没有或很少有业务集成 6.2开发项目的本质特征 对于完全自主的业务,在某一层也是必须集成的:财务平衡表。 图6-17独立的业务部门共享共用的企业财务数据 6.3分布式数据仓库的开发 图6-18逻辑上属于同一个数据仓库 6.3分布式数据仓库的开发 图6-19在每个子公司建立局部数据仓库 6.3分布式数据仓库的开发 每个分部根据自己的需要创建特有的自主的数据仓库。 这种方法创建分布式企业数据仓库有几个优缺点。优点:能很快完成。不利:如果部门间的数据结构存在共性,这种方法不能识别或合理处理这样的共性。 6.3.1在分布的地理位置间协调开发 另一种方法就是尽量协调不同的局部组织间的局部数据仓库的开发项目。 当数据仓库技术的价值在分支机构表现出来后,公司就会决定建造一个企业数据仓库。 6.3.1在分布的地理位置间协调开发 一般来说,企业数据仓库采用迭代开发的方法。开始时,企业数据模型的规模较小、比较简单且限制于一个业务子集。在企业数据模型建立后,将形成企业数据仓库。 6.3.2 企业数据的分布式模型 企业数据仓库的数据源可能来自局部数据仓库,也可能来自局部操作型系统。这应该完全在分支机构确定。记录系统的定义大都需要几次循环往复。 6.3.2 企业数据的分布式模型 此外,一个重要的设计问题是从技术角度考虑如何将分支机构的记录系统数据创建和传送到企业数据仓库。在某些情况,正式“缓冲”数据保留在分支机构。而另一些情况,她们被传送到企业环境,且在分支机构不可存取。 6.3.2 企业数据的分布式模型 表现为汇总数据还是细节数据是由观察者的不同角度决定的。 图6-20在一个层次上是细节的而在另一个层次上是汇总的 6.3.2 企业数据的分布式模型 图6-21分布式公司的数据仓库可以非常类似于一些无关公司的数据仓库 6.3.3分布式数据仓库中的元数据 在整个分布式的企业数据仓库中元数据起着非常重要的作用,通过它可以协调不同地域的数据仓库中的数据结构。元数据是实现一致性和相容性的工具。 6.4在多种层次上构建数据仓库 图6-22不同的开发小组负责构建数据仓库的不同层次 A组负责建造高度汇总的数据,B组建造中度汇总的数据,C组建造当前的细节数据 6.4在多种层次上构件数据仓库 不同的开发小组同时建造同一数据仓库的不同汇总级时,一个有趣的问题是,正在建造当前细节级的开发小组在使用数据仓库的数据模型。 图6-22正在开发最低细节级的开发组使用该数据模型 6.4在多种层次上构件数据仓库 在数据仓库中管理建造不同汇总级的多个小组的问题之一,是数据仓库各层采用的技术平台的问题。 由于数据仓库的不同开发小组在开发不同级数据时通常采用不同平台,这就出现了互连性问题。 6.4在多种层次上构件数据仓库 管理低级细节数据的开发小组必须为在其基础上汇总并建立新层次的数据的开发小组提供一个正确的数据基础。 图6-23细节级数据是建立汇总级数据的基础 6.5多个小组建立当前细节级 问题一:费用 问题二:蜘蛛网 为了确保不创建冗余数据,必须创建一个反映公共细节数据的数据模型。 图6-24对所有开发小组,数据模型标识公用数据 6.5多个小组建立当前细节级 数据模型构成了数据仓库设计的基础。 图6-25数据仓库在物理上分布在多物理表和数据库中 6.5.1不同层的不同需求 图6-26数据仓库中的当前细节级包含各开发小组的特有数据 6.5.1不同层的不同需求 所有的这些细节数据肯定不存在冗余。 数据非冗余性仅仅限于非键码数据。主键数据肯定是冗余数据,因为外键用于将不同类型的数据

文档评论(0)

四娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档