网站大量收购闲置独家精品文档,联系QQ:2885784924

hadoop深入浅出-HDFS.pdf

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
hadoop深入浅出-HDFS

HADOOP深入浅出 HDFS 研发中心 付斌 目录 分布式文件系统 思考:自己设计一分布式文件系统? 仓库保管员:查 询/记录台账 提出入库请求 采购员(Client ) 办公室 存到2号仓库 直接沟通,送货 通知接收 通知存储 满了,请 求新库存 冗余存 储申请 冗 仓库1 仓库2 续 仓库3 余 仓库N 存 存 储 分布式文件系统(DFS ) • 分布式文件系统(Distributed File System ) • 数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作 系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机 器上的文件,这就是分布式文件管理系统 。 • 是一种允许文件通过网络在多台主机上分享的文件系统,可让多机器上的多用户分 享文件和存储空间。 • 通透性。让实际上是通过网络来访问文件的动作,由程序与用户看来,就像是访问 本地的磁盘一般。 • 容错。即使系统中有某些节点脱机,整体来说系统仍然可以持续运作而不会有数据 损失。 • 分布式文件管理系统很多,hdfs只是其中一种。适用于一次写入多次查询的情况, 不支持并发写情况,小文件不合适。 常见的分布式文件系统 常见的分布式文件系统有,GFS、HDFS、 Lustre 、Ceph 、GridFS 、mogileFS、 TFS、FastDFS等。各自适用于不同的领域。 它们都不是系统级的分布式文件系统,而 是应用级的分布式文件存储服务。 常见的分布式文件系统 GFS •Google公司为了满足本公司需求而开发的基于Linux的专有分布式文件系统。。尽管Google公布了 该系统的一些技术细节,但Google并没有将该系统的软件部分作为开源软件发布。 HDFS •Hadoop 实现了一个分布式文件系统(Hadoop Distributed File System ),简称HDFS。 Ceph •是加州大学圣克鲁兹分校的Sage weil攻读博士时开发的分布式文件系统,没有生产应用。 Lustre •Lustre是一个大

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档