- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
任军远;Google文件系统(GFS);Google需要一个支持海量存储的文件系统
购置昂贵的分布式文件系统与硬件?
;硬件出错是正常而非异常
系统应当由大量廉价、易损的硬件组成
必须保持文件系统整体的可靠性
主要负载是流数据读写
主要用于程序处理批量数据,而非与用户的交互或随机读写
数据写主要是“追加写”,“插入写”非常少
需要存储大尺寸的文件
存储的文件尺寸可能是GB或TB量级,而且应当能支持存储成千上万的大尺寸文件
;将文件划分为若干块(Chunk)存储
每个块固定大小(64M)
通过冗余来提高可靠性
每个数据块至少在3个数据块服务器上冗余
数据块损坏概率?
通过单个master来协调数据访问、元数据存储
结构简单,容易保持元数据一致性
无缓存
Why?
;单一Master, 若干ChunkServer;分布式系统设计告诉我们:
这是单点故障
这是性能瓶颈
GFS的解决办法
单点故障问题;GFS的解决办法
性能瓶颈问题;存储元数据
文件系统目录管理与加锁
与ChunkServer进行周期性通信
发送指令,搜集状态,跟踪数据块的完好性
数据块创建、复制及负载均衡
对ChunkServer的空间使用和访问速度进行负载均衡
对数据块进行复制、分散到ChunkServer上
一旦数据块冗余数小于最低数,就发起复制操作
平滑数据存储和访问请求的负载
;垃圾回收
在日志中记录删除操作,并将文件改名隐藏
缓慢地回收隐藏文件
与传统文件删除相比更简单、更安全
陈旧数据块删除
探测陈旧的数据块,并删除
;采用中心服务器模式
可以方便地增加Chunk Server
Master掌握系统内所有Chunk Server的情况,方便进行负载均衡
不存在元数据的一致性问题
;不缓存数据
GFS的文件操作大部分是流式读写,不存在大量的重复读写,使用Cache对性能提高不大
Chunk Server上的数据存取使用本地文件系统,如果某个Chunk读取频繁,文件系统具有Cache
从可行性看,Cache与实际数据的一致性维护也极其复杂
;在用户态下实现
直接利用Chunk Server的文件系统存取Chunk,实现简单
用户态应用调试较为简单,利于开发
用户态的GFS不会影响Chunk Server的稳定性
提供专用的访问接口
未提供标准的POSIX访问接口
降低GFS的实现复杂度
;GFS的容错机制
Chunk Server容错
每个Chunk有多个存储副本(通常是3个),分别存储于不通的服务器上
每个Chunk又划分为若干Block(64KB),每个Block对应一个32bit的校验码,保证数据正确(若某个Block错误,则转移至其他Chunk副本);GFS的容错机制
Master容错
三类元数据:命名空间(目录结构)、Chunk与文件名的映射以及Chunk副本的位置信息
前两类通过日志提供容错,Chunk副本信息存储于Chunk Server,Master出现故障时可恢复;超过50个GFS集群
每个集群包含数千个存储节点
管理着PB(1015Byte)级的数据;cStor云存储硬件架构;cStor云存储软件架构;cStor云存储硬件;Master Server (管理服务器 )
管理整个文件系统,存储各文件的元数据信息,调度各数据存储服务器
Data Server (数据存储服务器 )
存储文件数据,接受管理服务器的调度,为客户端提供数据传输
Client (客户端)
从管理服务器上获取修改元数据信息,并向数据服务器读写数据
;支持master节点双机镜像
控制流与数据流的分离
Cache机制
支持POSIX接口
支持加入节点动态扩展
支持节点损失实时自适应容错
;使用主备双节点方式解决单节点故障问题
主备切换时间短,且无数据丢失
数据访问不间断,而且性能不受影响
;解决了master节点的性能瓶颈问题; master节点在内存中保存metadata
Chunkserver节点利用本身的文件系统提供的 cache
Client 节点缓存metadata;客户无需学习专门的API接口
可应用在Linux和Windows等各种平台下;可以任意加入节点(包括硬盘)以扩展容量
采用负载均衡策略重新分布数据
;1:1 容错技术
1:2 容错技术
高顽存容错技术
;cStor云存储界面;cStor的性能;cStor性能;在某数据中心已经成功应用2年,期间未出现系统故障,节点故障均自动屏蔽。
另外还用于数字地球、视频监控、视频点播等领域。
;基于cStor的云分发系统;基于cStor的云处理系
您可能关注的文档
最近下载
- 臀位剖宫产护理查房.pptx VIP
- 北京市通州区2024-2025学年高三上学期期中质量检测数学试卷2.docx
- 美食推荐微信小程序的设计与实现.docx VIP
- 冬季预防训练伤部队ppt.pptx VIP
- 提高患者腕带佩戴依从性PDCA.docx VIP
- 《工程勘察设计收费标准》2002年修订本完整.pdf VIP
- TZS 0680—2025《医疗机构实验室生物安全管理组织架构规范》(水印版).pdf VIP
- SANKEN三肯变频器samco-ns TEXC-NS-002(小容量)使用手册调试说明书.pdf
- 标准图集-05R502-燃气工程设计施工.pdf VIP
- 不靠谱梦想该劝阻吗辩论赛 正方辩词一辩、二辩、三辩、四辩发言稿.docx VIP
原创力文档


文档评论(0)