分布式数据仓库.pptVIP

  • 1
  • 0
  • 约4.78千字
  • 约 62页
  • 2022-05-26 发布于重庆
  • 举报
6.1.2技术分布式数据仓库 图6-14添加服务器来保存数据仓库中数据的进程 第三十一页,共六十二页。 6.1.2技术分布式数据仓库 当数据仓库中的处理器扩展到一定数量时,网络上就会出现过量的传输负载。 问题不仅仅出现在一个查询要访问存储在多个服务器管理的数据,而且出现在需要从一台服务器上传输大量的数据。 第三十二页,共六十二页。 6.1.3独立开发的分布式数据仓库 数据仓库环境是以一种不协调的方式建立起来的,首先建立某一个数据仓库,然后再独立的建立另一个数据仓库。建立不同数据仓库缺乏协调性的原因通常是政策和机构上的差异,这种情况被称为独立演进的分布式数据仓库。 第三十三页,共六十二页。 图6-15多个小组建造数据仓库的四种可能方式,每种均与其他各种不同 第三十四页,共六十二页。 6.2开发项目的本质特征 完全无关的数据仓库: 图6-16四个完全独立的业务部门在业务级没有或很少有业务集成 第三十五页,共六十二页。 6.2开发项目的本质特征 对于完全自主的业务,在某一层也是必须集成的:财务平衡表。 图6-17独立的业务部门共享共用的企业财务数据 第三十六页,共六十二页。 6.3分布式数据仓库的开发 图6-18逻辑上属于同一个数据仓库 第三十七页,共六十二页。 6.3分布式数据仓库的开发 图6-19在每个子公司建立局部数据仓库 第三十八页,共六十二页。 6.3分布式数据仓库的开发 每个分部根据自己的需要创建特有的自主的数据仓库。 这种方法创建分布式企业数据仓库有几个优缺点。优点:能很快完成。不利:如果部门间的数据结构存在共性,这种方法不能识别或合理处理这样的共性。 第三十九页,共六十二页。 6.3.1在分布的地理位置间协调开发 另一种方法就是尽量协调不同的局部组织间的局部数据仓库的开发项目。 当数据仓库技术的价值在分支机构表现出来后,公司就会决定建造一个企业数据仓库。 第四十页,共六十二页。 6.3.1在分布的地理位置间协调开发 一般来说,企业数据仓库采用迭代开发的方法。开始时,企业数据模型的规模较小、比较简单且限制于一个业务子集。在企业数据模型建立后,将形成企业数据仓库。 第四十一页,共六十二页。 6.3.2 企业数据的分布式模型 企业数据仓库的数据源可能来自局部数据仓库,也可能来自局部操作型系统。这应该完全在分支机构确定。记录系统的定义大都需要几次循环往复。 第四十二页,共六十二页。 6.3.2 企业数据的分布式模型 此外,一个重要的设计问题是从技术角度考虑如何将分支机构的记录系统数据创建和传送到企业数据仓库。在某些情况,正式“缓冲”数据保留在分支机构。而另一些情况,她们被传送到企业环境,且在分支机构不可存取。 第四十三页,共六十二页。 6.3.2 企业数据的分布式模型 表现为汇总数据还是细节数据是由观察者的不同角度决定的。 图6-20在一个层次上是细节的而在另一个层次上是汇总的 第四十四页,共六十二页。 第6章 分布式数据仓库 第一页,共六十二页。 第6章 分布式数据仓库 6.1分布式数据仓库的类型 6.2开发项目的本质特征 6.3分布式数据仓库的开发 6.4在多种层次上构建数据仓库 6.5多个小组建立当前细节级 6.6公共细节数据采用多种平台 6.7小结 第二页,共六十二页。 6.1 分布式数据仓库的类型 6.1.1局部数据仓库和全局数据仓库 6.1.2技术分布式数据仓库 6.1.3独立开发的分布式数据仓库 第三页,共六十二页。 6.1.1 局部数据仓库和全局数据仓库 业务是在不同地域或不同的生产线上进行的。在这种情况下就出现了局部数据仓库和全局数据仓库。局部数据仓库是在远程站点上提供和处理数据,而全局数据仓库提供的是在整个业务范围集成后的数据。 第四页,共六十二页。 6.1.1 局部数据仓库和全局数据仓库 什么情况下需要建立分布式数据仓库? 当一个企业遍及世界各地时,总部和分支机构都需要信息。中心数据仓库负责采集数据,同时可以满足总部对企业信息需求。但是对于分布在不同国家的各个分支机构,仍然有建立各自的数据仓库的需要。这种情况下,就需要建立分布式数据仓库。数据以集中式和分布式两种方式存在。 第五页,共六十二页。 站点A 站点B 总部 站点C 操作型处理 图6-1 许多企业典型的业务处理拓扑图 6.1.

文档评论(0)

1亿VIP精品文档

相关文档