- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
16 《高性能计算发展与应用》 2013年第四期 总第四十五期
云计算中MapReduce计算模型模拟器简介
樊源泉 魏伟 段章峰 陈衡 伍卫国
西安交通大学 西安710049 eie.fyq@
摘要:
近年来,MapReduce已经成为大数据处理领域一个重要的计算模型。Hadoop是Apache的
一个开源项目,其中实现了MapReduce计算模型。由于出色的并行处理能力,Hadoop已成为
许多编程者喜欢的大数据处理工具。然而,为了更好的优化基于MapReduce的集群系统,制
定合理的作业调度策略,对MapReduce的模拟变得很有必要。因此,出现了一些分布式环境
下MapReduce的模拟器。本文总结了目前主流的MapReduce模拟器,分析了它们的工作流程,
同时指出了各个模拟器的优、缺点,帮助MapReduce的研究者更好的理解MapReduce的工作过
程,以达到优化基于MapReduce集群系统的目的。
关键词:Hadoop,MapReduce,模拟器
1. 简介 程序的设计,像OpenMP,MPI等,程序设计者需要
目前,数据密集型计算的出现,使得大规模 关注很多设计细节,比如数据分片,数据传输以及
数据密集型的应用在快速的、可接受的时间内求 节点间的通信等,因此对设计者的要求比较高,限
解成为可能。因此,它一经出现,便成为了学术界 制了其应用的广泛性。而MapReduce的一个重要的设
和工业界的研究热点。2006年google提出云计算, 计目标就是简化分布式程序的设计,其将所有并行
由于可以提供灵活动态的IT基础设施,可靠的计算 程序设计需要关注的设计细节都抽象成公共模块,
环境和可配置的软件服务,云计算再次引领着学 并交由系统来实现,用户只需要关注自己的应用程
术界和工业界的研究热潮。为了满足Google内部对 序的实现逻辑即可。从而大大简化了分布式程序设
快速增长的数据存储的需求,Google开发和实现了 计,提高了开发的效率。2)良好的扩展性。随着搜
[1] 索公司的发展,其产生和积累的数据量呈指数型增
Google File(GFS) 。 SystemGFS与传统的文件系
统在可靠性、可用性、可扩展性等方面有着相同的 长,当数据量达到一定的程度之后,现有的集群已
设计目标,同时考虑了应用负载和技术环境的影 经无法满足其计算能力和存储能力,而MapReduce就
响。为了解决大规模数据的处理问题,Google提出 可以使得管理员通过添加机器以达到线性扩展集群
[2] 能力的目的。3)高容错性:在大规模分布式集群环
了MapReduce计算模型,该模型利用并行编程的思
想,主要用于大规模数据集的处理。基于Google的 境下,随着集群规模的增大,例如:磁盘损坏、机
GFS和MapReduce编程模型,Apache基金会开发出了 器宕机、节点间通信失败等硬件故障和用户设计程
云计算框架Hadoop。目前,Hadoop已经成为国内外 序的Bug产生的软件故障会显著的增加,从而会导致
学术界和工业界重点研究分析对象。
您可能关注的文档
- “两点一线” 与“三位一体” 英汉表意符号与思维模式之不同.pdf
- Fluent 并行计算及其工程算例测试与分析.pdf
- UCP600 下信用证主要当事人风险分析.pdf
- 安徽省公共安全产业现状分析.pdf
- 昌宁县公益林补偿项目建设现状及对策探讨.pdf
- 创新物业小区综合管理思考.pdf
- 打造品牌特色专业提升我院核心竞争力.pdf
- 打造数学高效课堂真正实现减负增效.pdf
- 大学生创业意愿调查分析.pdf
- 大学生心理一致感与归因方式关系研究.pdf
- 期末复习专题-- 时文课外类文阅读理解 下期初中语文统编版七年级下册.docx
- 2025年上半年黑龙江工业学院事业单位工作人员31人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2025年上半年黑龙江哈尔滨市事业单位公开招聘工作人员85人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2025年上半年黑龙江七台河市事业单位公开招聘51人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 保俶塔申花实验学校等校2025年中考语文一模试卷.docx
- 晓天中学高二下学期第三次质量检测语文测试卷(含答案).docx
- 2025年三门县12345政务咨询投诉举报中心公开招聘笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 七年级下学期4月期中语文试题(含解析).docx
- 《信息技术与教育技术(一)》作业及答案1.pdf
- 《信息技术与教育技术(一)》作业及答案51.pdf
文档评论(0)