- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重庆大学硕士学位论文中文摘要
重庆大学硕士学位论文
中文摘要
I
I
摘 要
随着计算机网络和信息化技术的发展,人们每天要处理的信息正在以惊人的速 度增加,尤其是像 Google 这样的提供全球网页分析和处理的互联网公司,它每天 要通过 Google MapReduce 对数以 P 级的网页,音频和视频进行处理。Google 在数 据处理方面的成功促使 Apache 社区开发了开源版的 Hadoop MapReduce。开源版 本用 Java 语言实现,它用 HDFS 将集群的主要实体 NameNode, SecondName- Node 和 DataNode 连接起来,NameNode 是集群的管理者,它上面运行 JobTracker 主控 程序; SecondNameNode 是 NameNode 的 backup 服务器;DataNode 是 hadoop 集群 中用 TaskTracker 真正处理数据的计算机,当 DataNode 是多核计算机,且分配的 数据量小于是 64M 时,DataNode 的多核优势将不复存在,它只能利用其中一个核 心的计算机,其它核心则处 idle 状态。为了处理这种状况,本文提出了一种任务 级 MapReduce 模型,用它来代替传统的线程级 MapReduce。
本文在分析了 Hadoop 运行机制以及制约因素的基础上,搭建了 Hadoop 集群 运算平台,并对集群容易出现的故障给出了相应的解决方案。详细分析了线程级 MapReduce 的运作机制,然后在集群上通过对比实验提出了线程级 MapReduce 在 处理小块数据时的局限性。
本文将 intel 用 c++语言开发的 TBB 并行库与 Hadoop MapReduce 结合起来形 成了任务级的 MapReduce,并通过在集群上求 PI 的几组实验,证实了任务级 MapReduce 在小块数据处理方面的优势。
本文还通过实验的方式综合对比了这两种级别的 MapReduce 的性能,并提出 了核心总数,数据规模与性能之间的关系。
关键词:多核,集群,MapReduce,Hadoop,TBB
重庆大学硕士学位论文英文摘要
重庆大学硕士学位论文
英文摘要
II
II
ABSTRACT
With the development of computer networks and information technology, people have to deal with increasing information growing at an alarming rate every day, especially companies like Google who provides global analysis and processing of Internet pages and it uses Google MapReduce to process P-class of web pages, audio and video files. The success of Google’s large-scale data processing promotes the development of open-source version, Hadoop MapReduce, made by the Apache community. The open-source version of MapReduce is developed using Java language. It has three components: NameNode, SecondNameNode and DataNode. NameNode is manager of the cluster with a management process JobTracker running on it.SecondNamenode is a backup server of NameNode.DataNode are a cluster of computers which do the real processing work using TaskTracker.The three components above are connected using HDFS distributed file system.When DataNode is a multicore computer and its data given are samller than 64M, the advantage of DataNode with multi-core will c
您可能关注的文档
- 基于多幅无序图像的三维重建技术-计算机科学与技术专业论文.docx
- 基于多个转换波形的非介入式压力检测方法研究-控制工程专业论文.docx
- 基于改进粒子群优化算法的船舶推力分配研究-控制理论与控制工程专业论文.docx
- 基于改进粒子群优化算法的核磁共振数据处理研究-电子与通信工程专业论文.docx
- 基于改进粒子群优化算法的机器人路径规划研究-模式识别与智能系统专业论文.docx
- 基于多功能量子点生物传感器的基础与实用初步研究-应用化学专业论文.docx
- 基于改进粒子群优化算法的热连轧动态变规格研究-控制科学与工程专业论文.docx
- 基于改进量子进化核聚类算法的图像分割-信号与信息处理专业论文.docx
- 基于多核Boosting多特征组合高光谱分类技术研究-大地测量学与测量工程专业论文.docx
- 基于改进量子粒子群的视觉跟踪方法-模式识别与智能系统专业论文.docx
- 基于多核CPU的数据立方体并行计算方法研究-计算机科学与技术专业论文.docx
- 基于多核DSP的基带信号处理算法并行性究-通信与信息系统专业论文.docx
- 基于改进量子遗传算法的不确定性生产调度方法研究-控制理论与控制工程专业论文.docx
- 基于改进量子遗传算法的输电网扩展规划研究-电气工程专业论文.docx
- 基于多核DSP的实时图像处理平台研究-信号与信息处理专业论文.docx
- 基于多核DSP的信号采集处理板设计-电子与通信工程专业论文.docx
- 基于多核P4080的网络处理器控制平面的设计与实现-通信与信息系统专业论文.docx
- 基于改进流程IDOV的六西格玛设计应用研究-工业工程专业论文.docx
- 基于多核PowerPC通用信号处理板设计与实现-通信与信息系统专业论文.docx
- 基于多核并行计算的电力系统故障计算方法研究-电气工程专业论文.docx
最近下载
- 腾势-腾势X-产品使用说明书-经典版(插混)-QCJ6490ST6HEV-腾势X插电式混动SUV用户手册20191212.pdf VIP
- LCMS实用技术讲座.ppt VIP
- 变电站项目安全管理方案(范文模板).docx
- LC+LTCBDE:胆囊结石合并胆总管结石治疗的微创突破与临床价值探究.docx VIP
- 大学生职业生涯规划.pdf VIP
- 装载机结构及原理.ppt VIP
- 装载机基础知识.pptx VIP
- 微机原理与接口技术期末复习资料.pdf VIP
- 《有机化学》-鲁崇贤-课后习题答案(未按顺序排序,全).pdf VIP
- 女性全周期健康管理及诊疗策略题库答案-2025年华医网继续教育.docx VIP
原创力文档


文档评论(0)