- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于成本的MapReduce工作流优化器-中国云计算.PDF
64 2015 ,51(21) Computer Engineering and Applications 计算机工程与应用
基于成本的MapReduce 工作流优化器
冯秋燕
FENG Qiuyan
河南财经政法大学,郑州 450000
Henan University of Economics and Law, Zhengzhou 450000, China
FENG Qiuyan. Cost-based MapReduce workflow optimizers. Computer Engineering and Applications, 2015, 51
(21):64-69.
Abstract: Optimizations at different levels of the MapReduce stack have their advantages and disadvantages. For MapReduce
workload optimization problem, related concepts are proposed; cost-based optimization approaches and related technology
of MapReduce jobs are introduced and assessed through comparation with RoT; three MapReduce workflow optimizers are
presented for cost-based optimization of MapReduce workflows based on dataflow and resource dependencies. Cost-based
workflow optimization is evaluated. End-to-end evaluation of the workflow optimizer is described; the advantages and disad-
vantages of these three workflow optimizers are analyzed through experimental evaluation of their overhead.
Key words: MapReduce workloads; optimization; dataflow dependencies; resource dependencies; workflow optimizer
摘 要:对MapReduce 栈的不同层进行优化有各自的优缺点。针对MapReduce 工作负载的优化问题,提出了相关概
念;通过与RoT 的对比,介绍了MapReduce 工作基于成本的优化及所使用的相关技术,并对MapReduce 基于成本的
优化进行了评估;基于工作流中的数据流依赖和资源依赖关系,提出了三种工作流优化器,评估了基于成本的工作
流优化,并对工作流优化器进行了终端-对-终端的评估;通过实验评估了工作流优化器的优化开销并对这三种工作
流优化器的优缺点进行了对比分析。
关键词:MapReduce 工作负载;优化;数据流依赖;资源依赖;工作流优化器
文献标志码:A 中图分类号:TP311.5 doi :10.3778/j.issn.1002-8331.1310-0228
1 引言 置参数工作做了补充。文献[13]研究考虑了存储要求
在大数据分析方面,MapReduce 正迅速成为一个 和数据传送成本的数据-驱动调度方法。数据传送成本
对现有系统的可行的竞争者。MapReduce 目前在查询 和其他的调度级优化建立在任务调度器中,这些任务调
[1] [14]
性能峰值等方面落后于现有的系统 ;文献[2-4]通过对 度器由Hadoop、Dryad、SCOPE 这样的新系统提出 。
MapReduce 堆栈的不同层次的优化试图解决该问题。 总之,以前的MapReduce 工作的优化以与SQL 规
文献[5]基
文档评论(0)