基于HDFS的Fedora分布式存储实现研究-中国科学院文献情报中心.DOCVIP

基于HDFS的Fedora分布式存储实现研究-中国科学院文献情报中心.DOC

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HDFS的Fedora分布式存储实现研究-中国科学院文献情报中心

基于HDFS的Fedora分布式存储实现研究 师洪波1,2, 吴振新2 (1.中国科学院国家科学图书馆,北京 100190 2.中国科学院研究生院,北京 100190) 摘要:随着信息社会发展,海量数字信息资源存储的需求变得越来越普遍,使用分布式文件存储是一种有效的解决方案。本文通过分析Fedora的底层存储架构以及HDFS本身信息存储交互特点,给出了Fedora的HDFS的分布式存储实现方案,为今后使用Fedora进行分布式存储及管理提供了借鉴参考。 Study of Distributed File Storage Solution of Fedora Based on HDFS Abstract:With the development of information society, mass information storage needs become more and more common, and distributed file system is an effective solution. Based on analysis of the low level storage architecture of Fedora and the features of HDFS information communication, this paper gives out an distributed file storage solution for Fedora base on HDFS, and has good reference significance for future use and study of Fedora. 关键词:长期保存 Fedora 分布式存储 HDFS Hadoop Key Words:Long term preservation; Fedora; distributed file system; HDFS;Hadoop 引言 随着信息社会的发展,海量信息存储及分析处理在今天变得越来越普遍。在数字资源保存领域,需要保存处理的数字信息也急剧增长,使用传统的保存方式,不论是存储容量上、还是存储效率存储安全上,都难以满足保存海量数据的要求。分布式存储是解决海量信息存储及处理的有效方式,Apache开源基金支持的顶级项目Hadoop[[] Hadoop[EB/OL]. [2011-10-11]. /.]项目提供了开源分布式存储解决方案HDFS(Hadoop Distributed File System)[[] HDFS[EB/OL]. [2011-10-11]. /hdfs/.],提供了高效、安全的海量数据分布式存储平台。HDFS不仅提供了一个分布式存储环境,同时结合Hadoop的Map-Reduce[ [] Hadoop[EB/OL]. [2011-10-11]. /. [] HDFS[EB/OL]. [2011-10-11]. /hdfs/. [] MapReduce[EB/OL]. [2011-10-11]. /mapreduce/. [] Fedora[EB/OL]. [2011-10-11]. /. 分布式存储及HDFS架构特点 分布式文件系统 分布式文件系统是通过网络为用户提供远程文件服务的系统,它的设计目标之一是要使得用户感知不到其访问的是存储在远程服务器中的文件[[] George C, Jean D [] George C, Jean D, Tim K. Distributed systems: concepts and design(3rd Edition)[M]. Addison-Wesley Publishers Limited, 2000. 文献[ NOTEREF _Ref305744322 \h 5]提出了如图1所示的分布式文件系统的远程文件服务模型,主要由扁平文件(Flat File)服务、目录服务和客户端模块三部分组成。其中,扁平文件服务实现对服务器磁盘上保存的文件内容的操作,负责创建、删除文件以及读写文件的内容和属性,为每个文件创建惟一的文件标识符供后续操作时引用;目录服务实现的是文件的文本名字与其对应标识符之间的映射,负责目录的创建、删除以及目录中文件的增删和查找,生成的目录也是以文件方式保存并由扁平文件服务负责管理;客户端模块则是运行在客户端上,负责封装对扁平文件服务和目录服务的访问,提供了从客户端本地文件系统的文件操作接口到远程服务器的相关功能调用的映射。 图 SEQ 图 \* ARABIC 1分布式文件系统的远程文件服务模型[ NOTEREF _Ref305744322 \h \* MERGEFORMAT 5] HDFS的架构特点 架

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档