分布式数据库系统的发展趋势.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据库系统的发展趋势 小组成员:姚 芳 杨美娜 叶立楠 郭晓卓 类艳春 李顺顺 主要内容 10.1 并行数据服务器与分布式数据库系统 10.2 分布式知识库系统 10.3 分布式面向对象数据库 10.4 对象-关系数据库 10.5 本章小结 10.1 并行数据服务器与分布式数据库系统 10.1.1 并行数据服务器体系结构 1. 单处理器结构的局限性 其一,它不能发挥在很多应用中存在的内在可并行处理的特性。 其二,数据库管理性能受到I/O瓶颈的很大影响。 2. 多处理机结构的两种极端情况 定义:多处理机结构是通过高速通信介质连接的多个可独立处理的单元构成,各个独立处理单元都可独立执行各种查询、操作或子操作,管理独立的磁盘和支持磁盘的并行存取。 分类;多处理机的体系结构按其资源的共享性可分为很多种,其中存在两种极端情况,即完全共享资源结构(简称全共享结构)和完全不共享资源结构(简称全不共享结构或独占结构)。 完全共享资源结构 完全不共享资源结构 3.完全不共享结构与分布式数据库系统 完全不共享结构也可以看成是实现分布式数据库系统的特殊例子,其目的在于高功能计算机系统可以由几个较小和功能较弱的计算机系统代替。 相似之处:每—个站点可以由相同的局部系统管理;每—个站点都要设法实现全局数据目录、分布数据定义和控制、分布查询处理和分布事务管理。 不同之处:多处理机站点不能运行用户应用程序,应用程序是运行在应用服务器上的,应用服务器通过特定的网络和多处理机系统相连。 完全不共享结构更能达到两个重要目标:分布式数据库性能和可扩展性 10.1.2并行数据服务器数据定位 1. 与分布式数据库系统的相似性 在一个高速并行化的完全不共享数据服务器体系结构中,其数据定位与分布式数据库中的数据片段的定位具有相似性。 一个相似性是数据分片可以用于增加并行性和负载平衡。 另一个相似性是由于数据比程序大得多,程序应该尽可能地在数据存储的站点上运行。 2.与分布式数据库系统的区别 并行数据处理服分器的系统与分布式数据库系统方案有三个重要的不同: 应用目标不同:由于用户并不是专门使用某个特定的站点,所以不要求最大程度的本地性处理。 实现方式不同:各站点间采用高速网络互联,站点间数据传输代价相对较低。 各站点的地位不同:不存在全局应用和局部应用的概念,各个站点是完全独立的,在数据处理中起协同作用,无局部作用。 3.数据定位的策略 全分簇:将关系进行水平分片,把片段分布到系统中所有磁盘的站点上。为了确保数据分布的均匀性,可以通过关系的某个属性采用散列算法分片。 可变分簇:依据“分簇度”对关系进行分片。分簇度是关系数据分片的站点数量,它是关系大小和存取频率的函数。 在一个采用可变分簇的高并行系统中,如果负载是动态变化的,或者更新操作较多,为了负载均衡,需要频繁地进行结构重整。这种重整应该对运行在数据服务器上的已编译程序保持透明。为了实现这种独立性,对分布式数据查询可采用关联查询。一个解决方案是把“全局索引”复制到每—个站点上。全局索引确定了关系在各个站点的分布情况。从概念上说,全局索引是一个两级索引。—级为关于关系名的“主聚簇”,另一级为关于关系中某些属性的“次聚簇”。这个全局索引支持可变分簇,每个关系有不同的分簇等级。 例10.1 图10-6提供了工程数据库的全局索引的例子。这个数据库由下列关系组成: E (ENO, ENAME, DEPT, TITLE) S (TITLE, SAL) J (JNO, JNAME, BUDGET) G (ENO, JNO, RESP, DUR) 假设我们希望通过ENO=“E5”来定位在关系E中的元组。 全局索引例子 本地索引例子 10.1.3并行操作处理的算法 1.并行操作处理 并行操作处理主要利用关系操作的并行性。主要介绍数据库操作的SELECT和JOIN的并行算法,因为所有其他的二元操作都类似JOIN的处理。在分簇数据分布的数据库中,对SELECT 操作的处理与分片的分布式数据库是一样的,依赖SELECT谓词,操作可以在单一站点上执行,或者对任意复杂谓词,在关系分簇所在的所有站点上执行。如果全局索引采用类似B树结构进行组织,则对带有范围谓词的SELECT操作只在存储相关数据的站点上执行。 JOIN 的并行处理比SELECT更加复杂。采用高速网络环境的分布式JOIN算法,可成功地在分簇数据库中应用。此外,在系统运行时,利用全局索引可有效地并行执行。 下面介绍三种分簇数据库的并行JOIN算法:并行嵌套循环算法,

文档评论(0)

seunk + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档