- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北京大学信息科学技术学院学士学位论文
北京大学本科生学位论文
PAGE ii
PAGE 2
本科生毕业论文
题目:(中文) MapReduce的系统性能评估与Backup调度策略 (英文) Performance Evaluation and Backup tasks for MapReduce
姓 名: 陈日闪
学 号:
院 系: 信息科学技术学院
专 业: 计算机科学与技术
指导教师: 彭波
TIME \@ EEEE年O月A日 二〇〇九年五月二十六日
北京大学本科毕业论文导师评阅表
学生姓名
陈日闪
学生学号论文成绩
学院(系)
信息科学技术学院
学生所在专业
计算机
导师姓名
彭波
导师单位/
所在研究所
网络与信息系统
导师职称
讲师
论文题目
(中、英文)
MapReduce的系统性能评估与Backup调度策略
Performance Evaluation and Backup tasks for MapReduce
导师评语
(包含对论文的性质、难度、分量、综合训练等是否符合培养目标的目的等评价)
陈日闪同学的论文选题是海量数据处理基础设施中的MapReduce分布式计算平台的性能评估和优化。这个方向是目前云计算热潮中重要的技术问题之一,也是本实验室在研究和开发MapReduce实现环境TPlatform中面临亟需解决的问题,是进一步工作的基础。其选题合理,是一个探索和工程结合的工作,其难度和工作量适中。
陈日闪以系统性能分析,寻找系统性能优化点为目标,讨论了MapReduce运行系统的性能评估指标和方法,设计了基准测试程序集,在TPlatform系统上开展了若干评估实验。通过实验结果分析,给出了若干系统改进的建议,并在落后者问题上,具体通过修改任务调度算法来实现了一个优化改进。这一系列工作连贯,工作内容包括论文阅读,查考文献,系统和算法设计,性能评估实验,编码调试,分布式系统运行和部署等。本论文工作,作为一个科研综合训练完成得很好,符合培养目标。同时,本论文工作也存在一些不足,在深度和系统性上还可以更加深入,比如加入相关系统的对比实验,扩展更多的实验设计和分析等,这些可以在陈日闪同学进一步工作中来完善。
导师签名:
年 月 日
摘要
MapReduce是一个在海量数据上进行数据处理的并行编程模型,它特别适合于海量非结构化和结构化数据的搜索、分析和挖掘任务,已经开始被人们广泛使用。对于兴起的众多类似MapReduce系统来说,如何有效地评估和分析对比这些系统,成为当前一个需要解决的问题。
本文详细讨论了针对MapReduce运行系统的性能评估指标和方法,设计和选择一系列具有代表性的程序和数据作为基准,用来评估和分析MapReduce系统。在这一评估方法指导下,本文在我们自己实现的MapReduce运行系统——Tplatform平台上扩展了Profiling功能,然后进行了一系列评估实验,来分析和寻找系统性能瓶颈,为未来系统优化提供依据。通过实验我们发现了我们系统的一些可改进的问题如任务调度、落后者问题等等。我们选择了针对导致提交任务延迟增加的落后者问题,通过实现后备任务策略来尝试改进。经模拟实验结果显示,我们提出的改进策略能够有效地改进落后者问题的性能问题。
关键词:MapReduce,性能评估,落后者问题,后备任务策略
Abstract
MapReduce is becoming an important parallel programming paradigm for processing Internet scale data. It is widely used to process jobs such as searching, analyzing, and mining on large scale structured and semi-structured data. It is still a problem for the emerging MapReduce-like systems to analyze and evaluate systematically and efficiently.
This paper discus
您可能关注的文档
- 本科毕业(设计)论文.doc
- 本科毕业设计.doc
- 本科教学工作水平评估和高校自身发展关系.ppt
- 本试剂盒只能用于科学研究,不得用于医学诊断。.doc
- 本文件已经我单位审定,请按此文件发布.doc
- 本招标文件经我方审核确认,同意按此发布!.doc
- 本招标文件经我方审核确认,同意发布.doc
- 操作系统原理.ppt
- 曾都一中2013-2014学年高一语文检测题.doc
- 曾侯和编钟铭文补释.doc
- 中国国家标准 GB 14287.5-2025电气火灾监控系统 第5部分:测量热解粒子式电气火灾监控探测器.pdf
- 《GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存》.pdf
- GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求.pdf
- 《GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求》.pdf
- 《GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备》.pdf
- GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备.pdf
- GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
- 中国国家标准 GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
原创力文档


文档评论(0)