一种改进Hadoop数据放置策略_林伟伟.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进Hadoop数据放置策略_林伟伟.pdf

( ) 华南理工大学学报 自然科学版 40 1 Journal of South China University of Technology Vol. 40 No . 1 第 卷第 期 2012 1 (Natural Science Edition) January 2012 年 月 文章编号:1000-565X (2012)01-0152-07 * 一种改进的Hadoop 数据放置策略 林伟伟 ( , 510006) 华南理工大学计算机科学与工程学院 广东广州 : Hadoop , , 摘 要 采用现有的 默认数据放置策略时 若本地数据副本失效 从远程结点上 , 恢复数据需要耗费大量数据传输时间 且随机选取数据放置结点可能会影响数据放置的 . , . 负载均衡 为此 文中提出一种改进的数据放置策略 该策略基于结点网络距离与数据负 , , 载计算每个结点的调度评价值 据此选择一个最佳的远程数据副本的放置结点 从而既能 , . Hadoop 实现数据放置的负载均衡 又能实现良好的数据传输性能 在 平台上实现了所提 , , , 出的数据副本放置改进策略 结果表明 与系统默认策略相比 文中提出的策略不仅可以 改进数据放置的负载均衡,而且可以减少数据副本放置的时间. :Hadoop ; ; ; 关键词 数据放置 负载均衡 策略 中图分类号:TP 393 doi :10 . 3969 /j . issn. 1000-565X. 20 12 . 0 1. 026 [1-2] , . , 随着互联网和分布式计算技术 的发展 出现 体系中的一个重要问题 由于集群由大量机器组成 , 了越来越多的数据密集型应用 这些应用常常需要 . 存储结点的故障就不可避免 为了避免个别结点的 TB (10 12 B) , 、 涉及数 的数据 如何高效 可靠而又方便 失效导致数据永久性的丢失. Hadoop 将数据的多个 . 地处理大量的数据成为当前一个重要研究方向 与 ,

您可能关注的文档

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档