Ceph 的数据分布算法.pdfVIP

  • 0
  • 0
  • 约7千字
  • 约 10页
  • 2026-04-07 发布于河北
  • 举报

1.引言

数据分布是分布式存储系统的要解决的首要问题,在分布式存储系统当中,最核

心也是最基本的要求就是数据的分布算或者规则能够解决以下几个问题:

(1)数据负载均衡:数据能够均匀地分布在磁盘容量不等的存储节点;

(2)故障隔离:保障不同的数据副本分布于不同的故障隔离域;

(3)节点变动与数据迁移:正常节点上的迁移影响达到最小,数据量达到最少。

很多分布式存储系统都会用到一致性哈希算来支撑其数据的均衡分布。例如在

Aamzon的Dyanmo键值存储系统QpenStack的Swift对象存储系统。而Ceph

的数据分布主要是靠哈希和CRUSH算支撑的,而CRUSH算又是其核心算

2.Object.PG映射算

2.1映射过程

从客户端维度看Obect-PG的过程,需要经过两个关键步骤:

(1)File-Obect:将文件按照固定粒度大小(2M/4M)进行切分,得到对

象(Ob-ID);

(2)Obect—PG:通过哈希算HASH(Ob-ID

文档评论(0)

1亿VIP精品文档

相关文档