第4章 HBase的读写基本操作 (1).pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

HBase的读写流程第4章

学习目标1.深入了解RegionServer架构2.了解HBase写流程3.了解HBase读流程4.了解Hbase自动优化过程

HBaseContents目录读流程3RegionServer架构写流程21自动优化过程4

4.1RegionServer架构

4.1RegionServer架构Store一个Region由多个Store组成,一个Store对应一个CF(列族)Store中包含位于内存中的Memstore文件和位于磁盘的Storefile文件。Memstore与Storefile写操作先写入Memstore,当Memstore中的数据达到某个阈值,会将其刷写到磁盘中,生成一个Storefile文件。因此,在一张表刚刚创建之时,系统里只会有Memstore文件,当数据达到一定量或插入数据一段时间后,才会出现Storefile文件。

4.1RegionServer架构WAL(writeaheadlog)由于数据要先写入MemStore后才能刷写到HFile,储存在内存也会面临一定风险。为了解决这个问题,数据会先写在一个叫做Hlog的文件中,之后再写入MemStore。该文件包含详细的写入信息,包括Region位置,写入数据,写入时间等等。若写入时出现系统故障,可以通过这个日志文件重建数据。BlockCache读缓存,每次查询出的数据都会缓存在BlockCache中,作为热点数据,方便下次查询。

4.2写流程

4.2写流程写流程:1)Client访问zookeeper,获取meta表(存储每张表RowKey的分布情况)位置;2)访问meta表,根据写请求的RowKey,查询出数据应当位于哪个Region中;3)与目标RegionServer进行通讯;4)将数据顺序写入(追加)到WAL中;5)将数据写入对应的MemStore,返回写入成功信息;6)当MemStore中的数据大小达到阈值或距离上次溢写达到一定时间,将MemStore溢写至磁盘中形成StoreFile;7)将meta表的位置信息缓存,方便下次访问。

4.3读流程

4.3读流程读流程1)Client访问zookeeper,获取meta表(存储每张表RowKey的分布情况)位置;2)访问meta表,根据写请求的RowKey,查询出数据应当位于哪个Region中;3)与目标RegionServer进行通讯;4)先后在BlockCache、MemStore、StoreFile中,根据RowKey寻找数据,如有不同时间戳版本,将所有数据进整合;5)将查询到的新的数据块信息缓存到BlockCache作为热点信息;6)将合并后的最终结果返回给客户端;7)将meta表的位置信息缓存,方便下次访问。

4.4HBase自优化StoreFileCompaction(合并)由于memstore每次刷写都会生成一个新的HFile,且同一个字段的不同版本(timestamp)和不同类型(Put/Delete操作)有可能会分布在不同的HFile中,因此查询时需要遍历所有的HFile。为了减少HFile的个数,以及清理掉过期和删除的数据,会进行StoreFileCompaction。Compaction分为两种,分别是MinorCompaction和MajorCompaction。MinorCompaction会将临近的若干个较小的HFile合并成一个较大的HFile,并清理掉部分过期和删除的数据。MajorCompaction会将一个Store下的所有的HFile合并成一个大HFile,并且会清理掉所有过期和删除的数据。

4.4HBase自优化

4.4HBase自优化RegionSplit(切割)默认情况下,每个Table初始有一个Region。随着数据的不断写入,Region会自动进行拆分。刚拆分时,两个子Region都位于当前的RegionServer,但处于负载均衡的考虑,HMaster有可能会将某个Region转移给其他的RegionServer。RegionSplit时机:当1个region中的某个Store下所有StoreFile的总大小超过Min(initialSize*R^3,hbase.hregion.max.filesize),该Region就会进行拆分。依照默认设置,具体如下:第一次split阈值=1^3*256=256MB;第二次split阈值=2^3*256=2048MB…以此类推,直到到达最大阈值(10GB),之后每10GB拆分一次

4.4HBase自优化

文档评论(0)

vermonth155-2娟 + 关注
实名认证
文档贡献者

专注ppt课件

版权声明书
用户编号:8046135067000064

1亿VIP精品文档

相关文档