云计算的分布式计算框架讲解学习.pdf

云计算的分布式计算框架讲解学习.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

云计算的分布式计算

框架

精品资料

思特奇分布式计算技术介绍

(V1.0)

北京神州数码思特奇信息技术股份有限公司

二〇二〇年八月

2

仅供学习与交流,如有侵权请联系网站删除谢谢

精品资料

文档信息

文档名称

电子文档MicrosoftWORD2003

文件状态□草稿□正式发布□正在修改

编写人日期2009年02月27日

校对人日期年月日

审核人日期年月日

批准人日期年月日

变更记录

变更变更变更前变更后生效

变更原因更改人批准人备注

序号页码版本号版本号日期

1文档建立0.1

1引言

框架中最核心的设计就是:MapReduce和HDFS。MapReduce就是“任务的分

解与结果的汇总”。HDFS是分布式文件系统,为分布式计算存储提供了底层支

持。

3

仅供学习与交流,如有侵权请联系网站删除谢谢

精品资料

MapReduce先将一个任务分解成为多个任务,“Reduce”就是将分解后多任

务处理的结果汇总起来,得出最后的分析结果。在分布式系统中,机器集群把

硬件看作资源池,将并行的任务拆分,然后交由每一个空闲机器资源去处理,能

够极大地提高计算效率,同时这种资源无关性,对于计算集群的扩展无疑提供

了最好的设计保证。分布式计算就好比蚂蚁吃大象,廉价的机器群可以匹敌任何

高性能的计算机。任务分解处理以后,那就需要将处理以后的结果再汇总起来,

这就是Reduce要做的工作。

2HDFS分布式文件系统

HDFS是分布式计算的存储基石,具有如下几个特点:

a)对于整个集群单一的命名空间。

b)数据一致性。适合一次写入多次读取的模型,客户端在文件没有被成功

创建之前无法看到文件存在。

c)文件会被分割成多个文件块,每个文件块被分配存储到数据节点上,而

且根据配置会由复制文件块来保证数据的安全性。

HDFS采用master/slave架构。一个HDFS集群由一个Namenode和一定数目

的Datanode组成。Namenode是一个中心服务器,负责管理文件系统的

namespace和客户端对文件的访问。Datanode在集群中一般是一个节点一个,负

责管理节点上它们附带的存储。在内部,一个文件分成一个或多个block,这

些block存储在Datanode集合里。Namenode执行文件系统的namespace操作,

例如打开、关闭、重命名文件和目录,同时决定block到具体Datanode节点的

映射。Datanode在Name

文档评论(0)

195****9852 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档