- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据库的数据分配算法.ppt
分布式数据库的数据分配算法 主要内容 一、数据分配问题的提出 二、典型数据分配算法分析与对比 三、数据分配的研究趋势 一、数据分配问题的提出 在分布式数据库系统的设计中,数据分配主要是解决数据片段在分布式系统各节点上的分布。当然,解决方案应满足一定的优化标准,其实质是要得到一个最优分配方案。不过这样的问题因其复杂性太大被列为NP难题。在很多实际应用中,其实也并不一定要得到最优分配方案,一个足够接近最优分配方案的近似最优分配方案往往也可以满足要求。 国内外学者在数据分配的基本原则上是有两点共识的。 (1)数据应尽可能靠近要使用它的站点,并用负载平衡方法找出一个系统性能的全局优化。 (2)检索事务应尽量局部化;更新事务所涉及的数据片段的副本不宜过多,以减少保持数据一致性的代价。对于分布式数据库系统的应用需求和理论研究,国外都要领先于国内。对于数据分配问题的研究,国外学者在基础理论方面贡献颇多,如文献[8] 中提出的方法对于避免由于系统I/O瓶颈造成的效率下降提供了帮助。 国内学者在对该问题的研究上虽然起步较晚,但是也逐步跟上领先者的步伐,获得不少研究成果,如“启发式试消副本法”在降低分配算法的复杂度方面有很好的效果。 二、典型数据分配算法分析与对比 对于分布式数据库的数据分配方法,国内外学者的研究从未间断,下面列举四个典型方法。 2.1 分组局部优化法 分组局部优化的数据分配方法的算法思想为:将片段等分成若干个组(最后一个组的片段数可能少于前面组的片段数),设定一个初始分配L0。首先对一个组获得各种分配方案而不考虑其它组的分配,以此获得整体n个片段的各种分配方案,从中选择最优的,得到该组的局部最优。按照这个方法对余下的每个组进行分配得到各组的局部优化,由此获得一个总体的优化分配方案L1,比较L1和L0的代价误差,若误差未满足条件,再对上述过程进行迭代处理直至误差满足条件。 优缺点:分组局部优化中代价公式本身是很复杂的,难于理解。它既考虑了单目查询和双目查询,又考虑了本地处理代价和通信代价,要确定哪些是单目运算,哪些是双目运算很不容易,公式的复杂性很高,算法的可操作性差,不利于实际应用。 2.2 启发式添加副本法 该方法的主要思想是:设待分配的数据片段为Fj,首先用最佳适应法确定一个非冗余的最佳分配方案,然后再分别计算在剩余的场地中的一个场地上增加片段Fj的副本后整个系统的总费用,找出其中的最小费用,如果该费用大于增加Fj副本前的最小费用,则停止计算;否则,决定在相应的场地上增加数据片段Fj的副本。这样一直计算下去,直到找出最小费用为止。 优缺点:添加副本法是一种典型的启发式方法。它不但考虑到副本之间的相互影响,还考虑到随着副本的增加而带来的费用上升问题。从总的代价因素来考虑,增加副本数与提高系统的可靠性之间不是线性关系。从以往经验来看, 当副本数为2或3时,系统费用较理想。当副本数进一步增加时,系统费用不一定会降低,甚至有可能上升. 在此方法中,形成初始分配的方法是采用非冗余最佳适应法。非冗余最佳适应法非本文的主要参考,不作详述,只介绍一下它的优缺点。 用非冗余最佳适应法进行数据分配,存储代价最小,但是系统的可用性、可靠性和数据的访问效率不高,并且没有体现出分布式数据库系统的优越性。另外,假设数据片段的数量为m,站点数为q,则非冗余最佳适应法在每次决定分配某个数据片段之前要计算q次全局代价,然后将q个结果进行比较。随着已分配的数据片段的增多,每次的计算量会越来越大。这种不使用启发式公式而用大量的计算的方式,严重影响了初始分配的效率,也给整个启发式添加副本法的算法复杂性带来不利的影响。 2. 3 启发式试消副本法 启发式试消副本法的基本思路是:对检索应用,可以按照应用发出的原始站点将目标片段放在应用所在站点而使得检索最优。这样一来,每个数据片段可能有多个副本分布在网络的多个站点上。对更新应用,则会因为要维护多个站点上片段多副本的数据一致性而增加开销。因此,第一步仅考虑检索需求片段的完全本地化,即先保证检索应用最优,得到初始分配,显然这种初始分配对更新应用是最坏的。然后再考虑更新应用的影响,逐步消除片段副本数以减小更新的通信代价。 其间,用目标函数作为衡量其副本是否该被消除的判断依据,当去掉一个片段副本时,计算产生的总代价是否小于原方案(未去掉该片段副本时的中间方案),若是就消除该片段副本,否则不消除,目的是尽可能使最终的分配方案的总代价最小。 该算法是一种启发式算法,第一步,基于条件设定,可以根据检索访问矩阵和检索事务执行频率矩阵很容易地得到初始片段分配表;第二步以第一步得到的分配表为基础,逐步消除片段副本。在消除片段副本的过程中,目
您可能关注的文档
- 光缆敷设施工方案.doc
- 光通信设备技术协议书.doc
- 兔流行性腹胀病的病因和防治研究.doc
- 党内知识考核手册.doc
- 党支部的工作研究.ppt
- 党课知识点.doc
- 全国中小学教师信息技术应用能力提升工程年度规划书.doc
- 全球钛原料现状与市场展望.doc
- 全省掘进光面爆破及锚网喷联合支护技术培训资料.doc
- 全蝎的研究进展.doc
- 2025年网络文学平台版权运营模式创新与版权保护体系构建.docx
- 数字藏品市场运营策略洞察:2025年市场风险与应对策略分析.docx
- 全球新能源汽车产业政策法规与市场前景白皮书.docx
- 工业互联网平台安全标准制定:安全防护与合规性监管策略.docx
- 剧本杀剧本创作审核标准2025年优化与行业自律.docx
- 2025年新能源电动巡逻车在城市安防中的应用对城市环境的影响分析.docx
- 全渠道零售案例精选:2025年行业创新实践报告.docx
- 2025年网约车司乘纠纷处理机制优化与行业可持续发展报告.docx
- 2025年宠物烘焙食品市场法规政策解读:合规经营与风险规避.docx
- 2025年宠物行业数据安全监管政策影响分析报告.docx
最近下载
- 汽车英语(第四版)习题答案.pdf VIP
- 苏科版《物质物理属性》复习总结课件.ppt VIP
- 一般过去时练习专项练习.docx VIP
- (市质检)福州市2025届高三第一次质量检测(一检) 语文试卷(含答案).docx
- 初中英语单词全集打印版.doc VIP
- 浪潮分布式存储InCloud Storage 用户手册.pdf VIP
- 量子传感技术的最新进展与应用.docx
- 专题20函数与相似综合问题-【压轴必刷】2022中考数学压轴大题之经典模型培优案(解析版).pdf VIP
- 医院医德医风考评制度及实施细则(最新版).docx
- (市质检)福州市2025届高三第一次质量检测(一检) 数学试卷(含答案).docx
文档评论(0)