多数据中心非结构化数据复制方法的研究.pdfVIP

多数据中心非结构化数据复制方法的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文摘要 摘要: W曲2.0时代改变了互联网,互联网用户的交互行为产生了越来越多的非结构 化数据,存储于分布在世界各地的数据中心中。每个数据中心拥有数量庞大的服 务器,基于备份和读取性能的原因,在这些不同地理位置的数据中心之间进行数 据复制十分必要。 论文研究了非结构化列族数据库(Hbase)复制时的数据筛选和存储方式;讨 论了针对Hbase数据中心的数据复制方式及其域间复制网络,研究了区域中拥有 多核心和共享核心对域间复制网络可扩展性的影响,在域间网络路由熵的可扩展 性理论基础上进行了比较;最后根据最早截止时间优先调度算法(earliestdeadline first:EDF)的理论,研究了基于优先级增长概率的优先级复制任务队列。 论文的主要工作如下: 基于HBase按列族存储的特点,在复制时直接对列族进行筛选和存储。并且 讨论了一种二维哈希寻址方案,根据表和列族进行相对集中的存储和寻址,加大 了读取的效率,减少了并发连接;在此基础上改进了在目标数据中心中随机选取 一组复制节点的方法。 改进了构建复制网络和通过网边直接进行复制的数据复制方法;在此基础上 提出了共享核心域间网络的源.核心复制树生成算法,并用路由熵的理论对域间复 制网络的可扩展性进行了评估,其可扩展性好于传统域问网络。 建立了基于优先级增长概率的动态优先级复制任务队列,研究了这种概率序 列的生成和修正方法,编程测试结果表明其表现符合实际要求。同时探讨了复制 任务的合并及其优先级增长概率与合并任务数的关系。 关键词:分布式数据中心;非结构化数据复制;一致性哈希;域间复制;优先级 队列 分类号:TP319 ABSTRACT ABS’l。RAC’I’: Intemetis W曲2.0.More challged andmorenon.s仃uctul旧dataare by being interactionusers.Thesenon—stmctur.edataarestored generatedby anlong indatacenters aUaroulldthe w}licht11erearea of world,in seⅣers.Data large锄ount replication be帆een datacentersfbmdi岱。rentlocationsis moreaIldmorea becoming pressing needfordata aJld bacl(uppe响mallcerequirernent. We metllodshowHBasefilters锄d improVe storesdatawhen replicating.An e仃ectiVefordata isdiscussedeXtendedtointer ismen way r印licating domain,which tobewithmulti·coresand improVed shared-cores fonⅣarda scalable.Finally’we

文档评论(0)

liybai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档