MapReduce的系统性能评估与Backup调度策略论文推荐.docVIP

  • 5
  • 0
  • 约4.14万字
  • 约 37页
  • 2018-04-26 发布于湖北
  • 举报

MapReduce的系统性能评估与Backup调度策略论文推荐.doc

MapReduce的系统性能评估与Backup调度策略论文推荐

摘要 MapReduce是一个在海量数据上进行数据处理的并行编程模型,它特别适合于海量非结构化和结构化数据的搜索、分析和挖掘任务,已经开始被人们广泛使用。对于兴起的众多类似MapReduce系统来说,如何有效地评估和分析对比这些系统,成为当前一个需要解决的问题。 本文详细讨论了针对MapReduce运行系统的性能评估指标和方法,设计和选择一系列具有代表性的程序和数据作为基准,用来评估和分析MapReduce系统。在这一评估方法指导下,本文在我们自己实现的MapReduce运行系统Tplatform平台上扩展了Profiling功能,然后进行了一系列评估实验,来分析和寻找系统性能瓶颈,为未来系统优化提供依据。通过实验我们发现了我们系统的一些可改进的问题如任务调度、落后者问题等等。我们选择了针对导致提交任务延迟增加的落后者问题,通过实现后备任务策略来尝试改进。经模拟实验结果显示,我们提出的改进策略能够有效地改进落后者问题的性能问题。 关键词:MapReduce,性能评估,落后者问题,后备任务策略 Abstract MapReduce is becoming an important parallel programming paradigm for processing Internet scale data. It is widely used to process jobs su

文档评论(0)

1亿VIP精品文档

相关文档