第十章、分布式件系统名字空间实现研究.docVIP

第十章、分布式件系统名字空间实现研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章、分布式件系统名字空间实现研究.doc

第十章.分布式文件系统名字空间实现研究 1、 空间概述 名字空间(Namespace)即文件系统文件目录的组织方式,是文件系统的重要 组成部分,为用户捉供可视化的、可理解的文件系统视图,从而解决或降低人类 与计算机之间在数据存储上的语义间隔。目前树状结构的文件系统组织方式与现 实世界的组织结构最为相似,被人们所广泛接受。因此绝大多数的文件系统皆以 Tree方式来组织文件目录,包括各种磁盘文件系统(EXTx, XFS, JFS, Rciscrfs, ZFS, Btrfs, NTFS, FAT32 等)、网络文件系统(NFS, AES, C1FS/SMB 等)、集群 文件系统(Lustre, PNFS, PVFS, GPFS, PanFS 等)、分布式文件系统(GoogleFS, HDFS, MFS, KFS, TaobaoFS, FastDFS 等)。 随着面向对象存储和云存储的发展,出现了一种称为偏平化(Flat)的文件系 统组织方式,典型代表有 Lustre, PanFS, Amazon S3, Google Storageo 这种 方式把所有文件目录看作对象Object,每一个对象有一个全局唯一的标识UUID, 户使用此UUID(而非路径)來访问存储系统。然而,UUID仅仅对计算机有意义, 在用户接口层往往还是需耍提供树状文件系统视图,再由系统在Path和UUTD 之间进行转换。在对象存储层,对象或对象数据分片以文件形式存储在磁盘文件 系统Z上,物理存储层仍然是树状存储结构。另外,对于法规遵从数据存储领域 广泛使用的固定内容存储系统CAS (Content addressed storage,内容寻址存 储),采用基于对象的存储系统,机制与此类似。 具体实现上,磁盘文件系统的名字空间宜接在磁盘上来实现,通常以 B*/B+/B-树的形式來组织,元数据和数据存储在相同的介质上。而对于分布式文 件系统来说,兀数据和数据和存储和访问是分离的,这是由高性能、可用性、可 扩展性等设计要求所决定的。通常,数据的存取由I/O服务器来实现,而元数据 由元数据服务器來负责。名字空间是元数据服务器的核心任务Z-,此外可能还 耍负责安全机制(如授权与认证)、锁机制、I/O负载均衡等。因此,rfl于元数据 与数据的分离,分布式文件系统名字空间实现的自由度比较大,实现方式有更多 的选择空间。这里将要介绍四种分布式文件系统名字空间实现机制,均为树状文 件系统视图,大致分为基于文件系统的实现和基于全内存的实现,但不包括基于 数据库的实现。基于数据库來实现文件系统名字间有众所周知的性能问题,尤其 是递归遍历文件目录空间。 2、 文件系统名字空间实现 基于文件系统的设计 这是一种〃站在巨人肩膀上〃的设计。磁盘文件系统本身就是树状结构视图, 因此可以利用这现成的机制在元数据服务器上实现名字空间。对于分布式文件系 统屮的每一个目录或文件,在元数据服务器的本地文件系统Z上一一对应创建一 个目录或文件(以下称为元目录和元文件),两者之间的映射关系如图1所示。元 目录用来表示DFS屮的目录,其元目录屈性保存DFS目录屈性;元文件用来表示 DFS中的文件,元文件属性保存DFS文件属性,元文件内容则用来保存元数据, 包括更详细的文件屈性、访问控制信息、数据分片信息、数据存储位置等信息。DFS名了空间本地文件系统名字空间 包括更详细的文件屈性、 访问控制信息、数据分片信息、数据存储位置等信息。 DFS名了空间 本地文件系统名字空间 图1基于文件系统的设计(DFS与本地文件系统名字映射) 基于文件系统我们以极小的代价构建了 DFS的名字空间,实现起来简单快速。 元文件仅用来存储数据文件的元数据,一般都是小于1KB的小文件,如果文件口 录数量达到千万量级就会形成LOSF(Lots of small files)的性能问题。实际应 用中如何來解决这种问题呢?目前主要有两种解决方法,一是采用适合海量小文 件存储的文件系统。Reiserfs对小文件存储进行了特别优化,它不仅文件查找 效率高,而且节省磁盘存储空间,实际测试结果也验证了这一点。二是采用高性 能的存储介质,尤其是I0PS指标。非常幸运,固态硬盘SSD技术上已经比较成 熟,成本不断降低,非常适合高性能的存储应用。SSD的特点是I0PS高,普通 SSD读写IPOS可以达到10000 ~ 50000,高端SSD甚至可以达到100000以上, 而FC、SAS、SATA磁盘的1POS基本小于300,远远小于SSD。因此,采用SSD 和Reiserfs文件系统,性能能够得到大幅提升,大多数应用问题不大。 (2)基于全内存的分层设计 这种方式与HDFS实现相仿。与基于文件系统的实现不同,名字空间完全在 元数据服务器的内存中,使用层次结构

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档