分布式数据库系统的数据分布策略研究.pdfVIP

分布式数据库系统的数据分布策略研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4 共建与共享实际操作过程中可能出现的问题 (1)软件及数据格式的统一; (2)标准与规范能否及时到位; (3)过渡期建库工作的安排; (4)经费来源保证。 分布式数据库系统的数据分布策略研究 陈 楠 (玉门石油管理局信息中心) 摘 要 数据分布是分布式数据库的主要特征。实现数据访向的局部化是分布式数据库设计的重要内容。文中介 绍了分布式数据库系统的主要特征及关键技术,重点对关系的分割和分布式数据的访问进行了讨论。 关镶词 数据分布 分布式数据库 分布透明性 关系分割 1 分布式数据库系统的主要特征与关键技术 在分布式数据库系统中,数据是分布存储的,一个事务所涉及的数据可能分布在多个节点上,这就要求 系统具有一个优化的分布查询策略。因而分布式数据库系统应具有以下的特征: (1)克服集中式数据库系统的主要问题:①部分服务器失败;②低速和高费用通信;③额外的管理开销。 (2)分布透明性:分布式数据库(DDB)要求数据的物理位置对于应用程序本身来说是透明的。数据在多 个服务器上的移动或重分布不要求应用程序本身有任何变化。 (3)节点自治:节点自治意味着分布式数据库系统中的每个数据库分别进行管理并与网络中其它数据库 独立。当一个数据库服务器与其它的远程服务器合作并存取这些远程服务器的数据时.它在功能上仍为独立 的系统 。 (4)全局命名空间:如果分布式查询或更新要引用两个或多个服务器上的数据,那么必须能唯一地区分 查询或更新语句中的每一个元素,因此必须有一个命名模式来保证服务器之间的数据名不能重复。 (5)分布式查询:多个服务器的分布查询是分布式数据库支持的最普遍的、最基本的功能。数据库服务器 软件必须具备以下特征:①通讯透明;②分布式查询优化;③分布式死锁检测。 (6)分布式更新:分布式更新要求分布式死锁检测机制来解决分布式更新(该更新引起排它锁的竞争)的 死锁问题。此外,还要求通过两阶段提交(2PC)来同步更新操作中服务器之间的动作。 (7)数据分布与复制:为了减少通讯开销,在某一服务器上的某些表中的数据应能被复制和分布到其它 远程数据库服务器节点上。这样就可以引用复制的数据与本地表在本地完成分布式查询操作。复制数据也 提高了分布式数据库的容错性。 如果复制的数据仅用于查询而不被更新,那么任何一个数据库服务器都能保存复制数据。有些数据库服 务器软件还能提供自动的建立和周期地刷新本地表复制数据(也称为快照日志,Snapshotlog)自动地更新 所有数据复制,这些日志文件保存了自上次更新以来表中所发生的变化。这种只更新所发生的修改而不是更 新整个表的方法能大大减少为保持多个副本的同步而要求的通信费用和开销。 如果修改操作是发生在复制版上,那么被修改的值(擂人或修改)必须传送到全部有该数据拷贝的所有 节点上。这时,就需要有并发和数据完整控制手段,因为不同节点上的用户有可能同时更新存储在不同复制 表中的相同的记录,所以通常情况下不允许直接对复制表进行更新。 (8)两阶段提交技术: 两阶段提交(2PC)用来协调参与一个更新中的多个服务器的活动以防止分布系统部分失败时出现数据 一 563 一 的不一致性。例如,如果一个更新操作要求位于三个不同节点上的记录被修改,但其中一个节点失败,这时, 另外两个节点必须检测到这个失败并取消它们所做的修改。为支持2PC一个分布式更新事务中涉及到的服 务器必须能够互相通信。通常,其中的一个服务器会被指定为 “控制”或 “提交”服务器并监控来自其它服务器 的信息。 在分布式更新期间,各服务器应预先标示它们已经完成(但未提交)指定给它们的分布式事务的那一部 分,并准备提交(以使它们的更新部分成为永久的)。这是2PC的第一阶段。如果有一节点不能响应,控制服 务器将指示其它节点回退分布式事务的各个部分。如果所有的节点都准备好,控制服务器就指示它们提交并 等待它们的响应。等待确认信息是2PC的第二阶段。在接到提交指示后,每一个服务器提交整个事务中自己 处理的那一部分。 2 数据分布策略 (1)数据分布的目的:数据分布最主要的目的是为了提高数据访问的局部性,即通过数据的合理

文档评论(0)

精品课件 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档