- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
HBase的读写流程第4章
学习目标1.深入了解RegionServer架构2.了解HBase写流程3.了解HBase读流程4.了解Hbase自动优化过程
HBaseContents目录读流程3RegionServer架构写流程21自动优化过程4
4.1RegionServer架构
4.1RegionServer架构Store一个Region由多个Store组成,一个Store对应一个CF(列族)Store中包含位于内存中的Memstore文件和位于磁盘的Storefile文件。Memstore与Storefile写操作先写入Memstore,当Memstore中的数据达到某个阈值,会将其刷写到磁盘中,生成一个Storefile文件。因此,在一张表刚刚创建之时,系统里只会有Memstore文件,当数据达到一定量或插入数据一段时间后,才会出现Storefile文件。
4.1RegionServer架构WAL(writeaheadlog)由于数据要先写入MemStore后才能刷写到HFile,储存在内存也会面临一定风险。为了解决这个问题,数据会先写在一个叫做Hlog的文件中,之后再写入MemStore。该文件包含详细的写入信息,包括Region位置,写入数据,写入时间等等。若写入时出现系统故障,可以通过这个日志文件重建数据。BlockCache读缓存,每次查询出的数据都会缓存在BlockCache中,作为热点数据,方便下次查询。
4.2写流程
4.2写流程写流程:1)Client访问zookeeper,获取meta表(存储每张表RowKey的分布情况)位置;2)访问meta表,根据写请求的RowKey,查询出数据应当位于哪个Region中;3)与目标RegionServer进行通讯;4)将数据顺序写入(追加)到WAL中;5)将数据写入对应的MemStore,返回写入成功信息;6)当MemStore中的数据大小达到阈值或距离上次溢写达到一定时间,将MemStore溢写至磁盘中形成StoreFile;7)将meta表的位置信息缓存,方便下次访问。
4.3读流程
4.3读流程读流程1)Client访问zookeeper,获取meta表(存储每张表RowKey的分布情况)位置;2)访问meta表,根据写请求的RowKey,查询出数据应当位于哪个Region中;3)与目标RegionServer进行通讯;4)先后在BlockCache、MemStore、StoreFile中,根据RowKey寻找数据,如有不同时间戳版本,将所有数据进整合;5)将查询到的新的数据块信息缓存到BlockCache作为热点信息;6)将合并后的最终结果返回给客户端;7)将meta表的位置信息缓存,方便下次访问。
4.4HBase自优化StoreFileCompaction(合并)由于memstore每次刷写都会生成一个新的HFile,且同一个字段的不同版本(timestamp)和不同类型(Put/Delete操作)有可能会分布在不同的HFile中,因此查询时需要遍历所有的HFile。为了减少HFile的个数,以及清理掉过期和删除的数据,会进行StoreFileCompaction。Compaction分为两种,分别是MinorCompaction和MajorCompaction。MinorCompaction会将临近的若干个较小的HFile合并成一个较大的HFile,并清理掉部分过期和删除的数据。MajorCompaction会将一个Store下的所有的HFile合并成一个大HFile,并且会清理掉所有过期和删除的数据。
4.4HBase自优化
4.4HBase自优化RegionSplit(切割)默认情况下,每个Table初始有一个Region。随着数据的不断写入,Region会自动进行拆分。刚拆分时,两个子Region都位于当前的RegionServer,但处于负载均衡的考虑,HMaster有可能会将某个Region转移给其他的RegionServer。RegionSplit时机:当1个region中的某个Store下所有StoreFile的总大小超过Min(initialSize*R^3,hbase.hregion.max.filesize),该Region就会进行拆分。依照默认设置,具体如下:第一次split阈值=1^3*256=256MB;第二次split阈值=2^3*256=2048MB…以此类推,直到到达最大阈值(10GB),之后每10GB拆分一次
4.4HBase自优化
您可能关注的文档
最近下载
- 苏教版(2024版)七年级上册生物期末复习知识点清单.docx VIP
- 修剪指甲教学课件.pptx VIP
- NB∕T 20006.4-2021 压水堆核电厂用合金钢 第4部分:反应堆压力容器接管嘴用锰-镍-钼钢锻件.pdf
- 《智慧仓储管理》课程标准.doc VIP
- 中国骨质疏松症及骨质疏松性骨折非药物干预防治指南(2025年版)PPT课件解读(2).docx VIP
- 13《少年中国说(节选)》 公开课一等奖创新教学设计.docx VIP
- 【行业研究报告】中国金融科技行业研究报告-2022年4月.pdf VIP
- 品种混杂退化原因PPT.ppt VIP
- 储罐内壁升降作业平台施工方案.doc VIP
- 【竞品分析文档】中国元宇宙产业竞品分析报告-2022年4月.pdf VIP
文档评论(0)