非结构化存储专项方案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

非结构化数据存放方案

一、存放类型体系:

1.1存放类型体系结构图

1.2存放类型体系描述

块存放:将存放区域划分为固定大小小块,是传统裸存设备存放空间对外暴露方法。块存放系统将大量磁盘设备经过SCSI/SAS或FCSAN和存放服务器连接,服务器直接经过SCSI/SAS或FC协议控制和访问数据。关键包含DAS和SAN两种存放方法。对比以下图:

分布式文件存放:文件存放以标准文件系统接口形式向应用系统提供海量非结构化数据存放空间。分布式文件系统把分布在局域网内各个计算机上共享文件夹集合成一个虚拟共享文件夹,将整个分布式文件资源以统一视图展现给用户。它对用户和应用程序屏蔽各个节点计算机底层文件系统差异,提供用户方便管理资源手段和统一访问接口。关键包含NAS和HDFS两种存放方法。

网络附加存放NAS结构图:

HDFS分布式文件系统存放结构图:

对象存放:对象存放为海量非结构化数据提供Key-Value这种经过键-值查找数据文件存放模式,提供了基于对象访问接口,有效地合并了NAS和SAN存放结构优势,经过高层次抽象含有NAS跨平台共享数据优点,支持直接访问含有SAN高性能和交换网络结构可伸缩性。关键包含swift和ceph两种实现形式。

Swift,OpenStackObjectStorage(Swift)是OpenStack项目标子项目之一,被称为对象存放。它构建在比较廉价标准硬件存放基础设施之上,无需采取RAID(磁盘冗余阵列),经过在软件层面引入一致性散列技术和数据冗余性,牺牲一定程度数据一致性来达成高可用性和可伸缩性,支持多租户模式、容器和对象读写操作,适合处理非结构化数据存放问题。

ceph,Linux下PB级分布式文件系统,可轻松扩展PB容量,提供了对多个工作负载高性能和高可靠性。它大致分为四部分:用户端(数据用户),元数据服务器(缓存和同时分布式元数据),一个对象存放集群(包含数据和元数据),和最终集群监视器(实施监视功效)。

二、非结构化大数据分布式存放架构

非结构化PB级大数据分布式存放架构,相对于其各自存放结构及不一样应用场景,结合国产化大数据平台特征,现给出两种处理方案。第一个是基于OpenStack子项目swift分布式大数据存放方案,另一个是基于ceph分布式大数据存放方案

2.1.1基于openStack子项目swift大数据分布式存放

Swift集群布署架构图:

实现原理:用户上传文件PUTDATA和下载文件GETDATA,分别请求同一个对象。上传文件时,PUT请求经过负载均衡管理器随即挑选一台ProxyServer,将请求转发给后者,后者经过查询当地Ring文件,选择3个不一样节点中后端来存放文件,然后同时将该文件向这三个存放节点发送文件。这个过程需要满足NWR策略,然后给用户返回写成功信息。下载文件时,GET请求也经过负载均衡管理器随机挑选一台ProxyServer,后者上Ring文件查询到这个文件存放节点位置并同时向后端查询,最少两个节点“表示”能够提供该文件,然后ProxyServer从中选择一个节点下载文件。

架构关键技术说明:

ProxyServer:是提供SwiftAPI服务器进程,负责Swift其它组件间相互通信。

StorageServer:提供了磁盘设备上存放服务。包含架构图上Object、Container和Account。

2.2基于ceph大数据分布式存放

Ceph集群布署架构图

文档评论(0)

可爱的家人6536 + 关注
实名认证
文档贡献者

可爱的家人

1亿VIP精品文档

相关文档