HDFS云存储技术可靠性简介.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

HDFS云存储技术可靠性简介

随着Web2.0的发展,信息量呈爆炸性增长,数据存储逐渐成为制约企业发展的关键问题。高可靠性、高通用性、高扩展性、大容量,云存储以传统数据中心无法比拟的优势特性,本文针对目前较流行的云存储技术HDFS,详细地分析了其可靠性特性。

引言

随着Web2.0的发展.信息量呈爆炸性增长.数据存储逐渐成为制约企业发展的关键问题。越来越多的企业开始将数据存储分离出来作为独立的项目进行管理。高可靠性、高通用性、高扩展性、大容量.云存储以传统数据中心无法比拟的优势特性.正在成为企业实现提高效率、降低成本的重要选择。HDFS是当前应用最广泛的云存储技术之一.本文详细分析HDFS云存储技术的可靠性

1、云计算技术系统结构

云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空问和信息服务。

点击图片查看大图

图1云计算技术体系结构

云计算技术体系结构分为4层:物理资源层、资源池层、管理中间件层和SOA构建层,如图1所示。物理资源层包括计算机、存储器、网络设施、数据库和软件等:资源池层是将大量相同类型的资源构成同构或接近同构的资源池,如计算资源池、数据资源池等。管理中间件负责对云计算的资源进行管理.并对众多应用任务进行调度,使资源能够高效、安全地为应用提供服务:S0A构建层将云计算能力封装成标准的WebServices服务,并纳入到SOA体系进行管理和使用.包括服务注册、查找、访问和构建服务工作流等。管理中间件和资源池层是云计算技术的最关键部分,SOA构建层的功能更多依靠外部设施提供。

云计算的管理中间件负责资源管理、任务管理、用户管理和安全管理等工作资源管理负责均衡地使用云资源节点.检测节点的故障并试图恢复或屏蔽之,并对资源的使用情况进行监视统计.对云计算的可靠性有至关重要的作用下面结合HDFS介绍云存储技术的可靠性。

2、HDFS体系结构

Hadoop是Apache基金会的一个开源项目.参考Google的GFS(GoogleFileSystem)和Map/Reduce计算模型研发出HDFS(HadoopDistributedFileSystem)和自己的Map/Reduce框架。Hadoop主要由Yahoo开发,Facebook、Amazon和Last.fm公司也都在使用Hadoop。

点击图片查看大图

图2HDFS体系结构

如图2所示.Hadoop档案系统(HadoopDistributedFileSystern.HDFS)被设计成适合运行在通用硬件上的分布式文件系统.其具有高容错性.能提供高吞吐量的数据访问.非常适合于大规模数据集上的应用。

3、HDFS可靠性

为了保障HDFS的高可靠性。HDFS有如下5个特性。

(1)冷备机制

HDFS中SecondaryNameNode对NameNode中元数据提供了冷备方案SecondaryNameNode将Na—meNode的fsimage与editlog从Namenode复制到临时目录,将fsitnage同editlog合并,并产生新的Fsimage并把产生的新的Isirnage上传给NameNode,最后清除NameNode中的editlog

(2)租约机制

NameNode在打开或创建一个文件,准备追加写之前,会与此客户端签订一份租约。客户端会定时轮询续签租约。NameNode始终在轮询检查所有租约,查看是否有到期未续的租约。如果一切正常,该客户端完成写操作,会关闭文件,停止租约,一旦有所意外,比如文件被删除了,客户端宕机了,当超过租约期限时,NameNode就会剥夺此租约,将这个文件的享用权,分配给他人。如此,来避免由于客户端停机带来的资源被长期霸占的问题。

(3)数据的正确性与一致性

在HDFS中,为了保证数据的正确性和同一份数据的一致性,做了大量的工作。首先,每一个数据块,都有一个版本标识,一旦数据块上的数据有所变化,此版本号将向前增加。在NameNode上,保存有此时每个数据块的版本,一旦出现数据服务器上相关数据块版本与其不一致,将会触发相关的恢复流程。这样的机制保证了各个数据服务器器上的数据块,在基本大方向上都是一致的。但是,由于网络的复杂性,简单的版本信息无法保证具体内容的一致性。因此,为了保证数据内容上的一致,必须要依照内容,给出签名。

当客户端向数据服务器追加写人数据包时,每一个数据包的数据,都会切分成512字节大小的段,作为.huisheliren签名验证的基本单位,在HDFS中,把这个数据段称为Chunk,即传输块。在

文档评论(0)

聚好信息咨询 + 关注
官方认证
服务提供商

本公司能够提供如下服务:办公文档整理、试卷、文档转换。

认证主体鹤壁市淇滨区聚好信息咨询服务部
IP属地河南
统一社会信用代码/组织机构代码
92410611MA40H8BL0Q

1亿VIP精品文档

相关文档