第五章 分布式据库设计.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5 分布式数据库设计 本章主要解决分布式数据库模型设计问题,具体指出数据分段与分配的方法,即数据分布问题。这些方法是面向应用开发人员的。 5 . 1 分布式数据库设计概述 考虑集中式数据库设计的内容: (1) 概念模式的设计(包括应用所需要的全部数据) 物理数据库设计,即将概念模式映射到存储区域,并决定合适的存取方法. 分布式也要做这两件事,只不过化为: 全局模式的设计 对应上面(1) 每个站点的本地物理数据库设计 (2) 解决的方法与集中式相同,都是用关系数据库规范化理论和文件的物理组织方法。 同时在第(1)与第(2)步之间还要做: (1) 分段模式的设计 (2) 分配模式的设计 这两方面恰好全面表征了数据分布设计的特点,二者互相关联,要综合考虑。 在设计数据库之前,必须充分了解需求,严格按照软件工程的方法来设计数据库,做好数据库应用系统中的关键一环。(核心问题) 需求应包括: (1)都有哪些应用和哪些用户?应用与用户的对应,每个用户的功能需求(给出用例图,详细描述每个应用所用的数据及处理流程、应用与应用之间的时序关系等) (2)每个应用发出的站点(原发站点) (3)每个应用被使用的频度 (4)每个应用对‘数据对象’访问的次数、访问类型、统计分布情况等 (5)每个‘数据对象’数据量的大小,值的分布情况。 (6)站点间的距离、传输单位信息的费用 5.1.1 数据分布设计的目标 (1)处理的本地性 把数据和使用它们的应用尽量靠近---当然最好是在原发站点 (2)可用性和可靠性 可用性---对只读应用,可就地使用副本 可靠性---在物理上分散的站点分别存放副本,一旦正在使用站点上的数据出了问题(如盘坏了),可使用其它站点上的数据。 (3)工作负荷均衡---各尽所能,要考虑每个站点的能力、效率不同等因素,也要与本地性折衷考虑。 (4)经济上的考虑---经费开销少(存储、CPU、I/O、通讯等),相比之下,优先考虑通讯。 (5)效率方面的考虑---本地性、通讯量少、负荷均等也都会提高效率(互补)。 上述几条目标应综合考虑,有些情况是互补的,有些情况又是矛盾的(可靠与同步更新)。特别地要优先考虑大频率的、费时的、实时的应用。 5.1.2 自顶向下和自底向上的数据分布设计方法 (1)自顶向下的方法 (2)自底向上的方法 5. 2 数据库分段设计(分段模式设计) 数据分布设计包括分段和分配设计,分配的最小的逻辑单位是段。分段是分配的起点,但并不是终点,分配过程中可能还有改变。 回顾分段设计的规则: (1)完整性---全局关系中的任意数据必存在于某个段中。 (2)可重构性---必须能够由段重新构成全局关系 (3)不相交性---主要是指水平分段和导出式水平分段,这2种分段方式必须是全局关系的一个划分,即任意一个元组只能属于一个段,并且用所有段的合并运算重构全局关系;但对于垂直分段,如没重复的数据则没有结合属性,也就无法重构全局关系。 对于混合分段,显然是递归进行的,每步或是水平与导出式水平分段、或是垂直分,只要每步都按照上述规则,混合分段的结果也必然满足上述规则。 5.2.1 水平分段与导出式水平分段的设计 5.2.1.1 水平分段(初级分段)的设计 根据分段的基本条件,水平分段意味着要确定一组能使分段不相交、且完整的选择谓语,也就是限定语。为了便于讨论,不防令R是一个全局关系,并引入下述定义: 简单谓语: pi : 属性名θ属性值 其中,θ 可以是算术比较、关系、集合等运算符。 (2)最小项谓语 设P简单谓语P1,P2,…,PN的集合,若Y是P的最小项谓语,则Y就是P中所有简单谓语的合取,其中每个简单谓语或者为自然形式,或者为否定形式,且Y不为永假。 即 Y =∧ pi* pi∈P 这里,pi*= pi,或者pi*= NOT pi,且Y≠永假 (3)一个段是一个最小项谓语所包含的所有元组的集合。 (4) 简单谓语pi与简单谓语集合P相关的条件是: 若P至少有两个最小项谓语(即至少有两个段),且其间的区别仅仅取决于pi两种形式(自然和否定),则至少有一个应用以不同的方法来访问相应的段。/////???? 问题:如何评价分段是比较好的?或称合适的? 可以这样回答:p 完整且最小。 所谓完整是指:同一个段中任意两个元组被任意应用等概率访问。 所谓最小是指:p 中每个pi都p与相关。 水平分段的方法: 5.2.1.2 导出式水平分段的设计 导出式水平分段应充分考虑段与段之间的分布式结合是否得到简化。 (1)充分调查两个全局关系的结合应用 (2)最好的方案是形成简单结合图。 (3)通常采用半结合或自然半结

文档评论(0)

huang37168huan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档