HBase_简介2教案解析.ppt

物理存储 * 5 、HRegion虽然是分布式存储的最小单元,但并不是存储的最小单元。 事实上,HRegion由一个或者多个Store组成,每个store保存一个columns family。 每个Strore又由一个memStore和0至多个StoreFile组成。如图: StoreFile以HFile格式保存在HDFS上。 物理存储 * HFile的格式为: 物理存储 HFile分为六个部分: Data Block 段:保存表中的数据,这部分可以被压缩 Meta Block段 (可选的):保存用户自定义的kv对,可以被压缩。 File Info 段:HFile的元信息,不被压缩,用户也可以在这一部分添加自己的元信息。 Data Block Index 段:Data Block的索引。每条索引的key是被索引的 block的第一条记录的key。 Meta Block Index段 (可选的):Meta Block的索引。 Trailer段:这一段是定长的。保存了每一段的偏移量,读取一个HFile时,会 首先读取Trailer,Trailer保存了每个段的起始位置(段的Magic Number用来 做安全check),然后,DataBlock Index会被读取到内存中,这样,当检索 某个key时,不需要扫描整个HFile,而只需从内存中找到ke

文档评论(0)

1亿VIP精品文档

相关文档