基于多变量动态算法的hadoop负载均衡优化与实现 optimization and realization of hadoop load balance mechanism based on a multivariable dynamic evaluate threshold algorithm.pdfVIP
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多变量动态算法的hadoop负载均衡优化与实现 optimization and realization of hadoop load balance mechanism based on a multivariable dynamic evaluate threshold algorithm
研究与开发
基于多变量动态算法的Hadoop负载均衡优化与实现木
武娟1,黄海1。钱锋1。李拥军2,寿质彬2
曛絮柔芝裟羹蓑莩磊数然篙昙薹羹纂塞瓣誓姜会要瓣
繁忙程度。动态估计均衡器的阈值,并给出了与估计阈值相关的计算公式,在此基础上采用集群
系统对上述算法进行了测试验证。实验结果表明,对比Hadoop系统自带的需要固定阈值的均衡
器,新方法能在均衡过程中利用系统相关信息动态估计阈值,对Hadoop的负载均衡优化取得更
加令人满意的效果。
关键谖 云计算:Hadoop分布式文件系统;负载均衡;阈值
文献标识码A
处理。以保证每个DataNode的文件块数量均衡。
1 引言
对于第一个均衡机制而言,根据Hadoop源码分析可
云计算是一种基于互联网的、大众参与的计算模式。 以得出Hadoop默认的数据块放置策略圆是在本地机架某
其计算资源是动态、可伸缩、虚拟化的.而且以服务的方式 台DataNode放置一个数据块副本。另外一个数据块副本存
放在不同(远端)的机架上的某台DataNode上,最后一个数
提供。Google是云计算研究的先驱者,陆续提出GFS模型、
据块副本放置在同一个远端机架的另外一台DataNode上。
MapReduce模型、BigTable模型,同时在Apache网站上发
这种策略减少了机架内的写负载.从而总体上提高了写性
布MapReduce和GFS对应的Hadoop开源项目.它是一个
运行在由大量廉价机器组成的集群上的分布云计算系统。 能。由于整个机架失效的概率要比单个节点失效的概率小
得多.因此这种方法不会影响数据的可靠性。但是,采用这
具有廉价、高效、可靠以及可伸缩等特点fIl。Hadoop利用
种策略,文件块并不是均匀地放置在HDFS里,2/3的数据
NameNode节点管理Hadoop集群.DataNode节点保存数
据,并且引入了负载均衡机制。其负载均衡包含两方面含 块被放置在了同一机架上。另外1,3被放置在了另一个机
义:其一是在保存文件和数据时,将文件块保存任务平摊 架上。当然,可以通过改变Hadoop数据块放置策略来优化
分给每个DataNode,让每个DataNode均匀保存一定数量其负载均衡机制。比如通过评价函数13】和加权二叉树【4l进行
的文件块;其二是当系统出现负载不均衡时(如系统加入 数据节点的选择等,都可以有效地避免集群在存储数据时
新的节点或现有节点发生故障),HDFS可以进行系统均衡造成的负载不均衡。
对于第二个均衡机制而言.则是在整个集群的负载不
+国家自然科学基金资助项目(No,广东省科技计划基
均衡的情况下进行的。比如当集群里增加了新的
金资助项目(No.20118010200039,No.20108090400436),广州市
科技计划基金资助项目fNo.11
万方数据
研究与并发
态两因素。因此,必须对时间和空间做出权衡以
DataNode的存储空间是很低的。如果新增加的DataNode
为几十个,则造成集群负载的严重不均衡。此时,需要人工 保证
您可能关注的文档
- 基于电压跌落状态估计的复杂配电网络故障路径搜索算法 a fault path searching algorithm based on voltage sag state estimation for complicated distribution systems.pdf
- 基于电压故障分量的故障元件定位方法研究 research on fault element location method based on voltage fault component.pdf
- 基于电压和电流突变量的高压直流输电线路保护原理 protection principle for hvdc transmission lines based on fault component of voltage and current.pdf
- 基于电压跟踪控制的微电网模式切换研究 tracking voltage control based microgrid mode conversion.pdf
- 基于电压角度控制的稳压发电系统研究 study of constant voltage generation system based on voltage angle control.pdf
- 基于电压和电流突变量方向的高压直流输电线路保护原理 a new protection principle for hvdc transmission lines based on directions of fault components of voltage and current.pdf
- 基于电压空间矢量的电动汽车电驱动系统高效快转矩响应控制 fast torque response control of high efficiency drives in electric vehicles based on voltage space vector.pdf
- 基于电压降的配电网故障恢复重构 the distribution network fault recodvery reconstructuion based on voltage drop.pdf
- 基于电压空间矢量的共模电压消除方法的研究 method of elimination scheme to common-mode voltage based on voltage space vector.pdf
- 基于电压空间矢量的滞环电流控制方法和apf的系统设计 hysteresis current control based on voltage space vector and apf system design.pdf
- 2012-2021北京重点校高一(下)期中语文汇编:词类活用.pdf
- 电力市场与经济运行优化:电力市场优化算法_(28).电力市场中的市场力分析.docx
- 医院培训课件:《俯卧位通气的护理》.pptx
- 电力市场与经济运行优化:电力系统能效优化方法_(1).电力市场基础理论.docx
- 电力市场与经济运行优化:电力系统能效优化方法_(9).电力系统运行与能效优化.docx
- 电力市场与经济运行优化:电力系统能效优化方法_(15).电力市场与环境影响分析.docx
- 电力市场与经济运行优化:电力系统优化调度_(1).电力市场基础与原理.docx
- 电力市场与经济运行优化:电力系统优化调度_(14).电力市场改革政策与影响.docx
- 电力市场与经济运行优化:电力系统运行优化_(4).电力系统运行基础.docx
- 2025年航运行业分析.docx
文档评论(0)