- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网易视频云:HBase BlockCache系列–走进BlockCac
网易视频云:HBaseBlockCache系列–走进BlockCac 和其他数据库一样,优化IO也是HBase提升性能的不二法宝,而提供缓存更是优化的重中之重。最理想的情况是,所有数据都能够缓存到内存,这样就不会有任何文件IO请求,读写性能必然会提升到极致。然而现实是残酷的,随着请求数据的不断增多,将数据全部缓存到内存显得不合实际。幸运的是,我们并不需要将所有数据都缓存起来,根据二八法则,80%的业务请求都集中在20%的热点数据上,因此将这部分数据缓存起就可以极大地提升系统性能。 HBase在实现中提供了两种缓存结构:MemStore和BlockCache。其中MemStore称为写缓存,HBase执行写操作首先会将数据写入MemStore,并顺序写入HLog,等满足一定条件后统一将MemStore中数据刷新到磁盘,这种设计可以极大地提升HBase的写性能。不仅如此,MemStore对于读性能也至关重要,假如没有MemStore,读取刚写入的数据就需要从文件中通过IO查找,这种代价显然是昂贵的!BlockCache称为读缓存,HBase会将一次文件查找的Block块缓存到Cache中,以便后续同一请求或者邻近数据查找请求,可以直接从内存中获取,避免昂贵的IO操作。MemStore相关知识可以戳这里,本文将重点分析BlockCache。 在介绍BlockCache之前,简单地回顾一下HBase中Block的概念,详细介绍戳这里。 Block是HBase中最小的数据存储单元,默认为64K,在建表语句中可以通过参数BlockSize指定。HBase中Block分为四种类型:Data Block,Index Block,Bloom Block和Meta Block。其中Data Block用于存储实际数据,通常情况下每个Data Block可以存放多条KeyValue数据对;Index Block和Bloom Block都用于优化随机读的查找路径,其中Index Block通过存储索引数据加快数据查找,而Bloom Block通过一定算法可以过滤掉部分一定不存在待查KeyValue的数据文件,减少不必要的IO操作;Meta Block主要存储整个HFile的元数据。 BlockCache是Region Server级别的,一个Region Server只有一个Block Cache,在Region Server启动的时候完成Block Cache的初始化工作。到目前为止,HBase先后实现了3种Block Cache方案,LRUBlockCache是最初的实现方案,也是默认的实现方案;HBase 0.92版本实现了第二种方案SlabCache,见HBASE-4027;HBase 0.96之后官方提供了另一种可选方案BucketCache,见HBASE-7404。 这三种方案的不同之处在于对内存的管理模式,其中LRUBlockCache是将所有数据都放入JVM Heap中,交给JVM进行管理。而后两者采用了不同机制将部分数据存储在堆外,交给HBase自己管理。这种演变过程是因为LRUBlockCache方案中JVM垃圾回收机制经常会导致程序长时间暂停,而采用堆外内存对数据进行管理可以有效避免这种情况发生。 LRUBlockCache HBase默认的BlockCache实现方案。Block数据块都存储在 JVM heap内,由JVM进行垃圾回收管理。它将内存从逻辑上分为了三块:single-access区、mutil-access区、in-memory区,分别占到整个BlockCache大小的25%、50%、25%。一次随机读中,一个Block块从HDFS中加载出来之后首先放入signle区,后续如果有多次请求访问到这块数据的话,就会将这块数据移到mutil-access区。而in-memory区表示数据可以常驻内存,一般用来存放访问频繁、数据量小的数据,比如元数据,用户也可以在建表的时候通过设置列族属性IN-MEMORY= true将此列族放入in-memory区。很显然,这种设计策略类似于JVM中young区、old区以及perm区。无论哪个区,系统都会采用严格的Least-Recently-Used算法,当BlockCache总量达到一定阈值之后就会启动淘汰机制,最少使用的Block会被置换出来,为新加载的Block预留空间。 SlabCache 为了解决LRUBlockCache方案中因为JVM垃圾回收导致的服务中断,SlabCache方案使用Java NIO DirectByteBuffer技术实现了堆外内存存储,不再由JVM管理数据内存。默认情况下,系统在初始化的时候会分配两个缓存区,分别占整个BlockCa
您可能关注的文档
- 写作中常用倒装.docx
- Unit3 Easter Eggs教学设计.doc
- 英语课堂教学实录.doc
- ESCP 打印指令使用.docx
- 《马克思主义基本原理》第四章练习及答案.doc
- Photoshop滤镜功能全讲解.doc
- painter工具栏中英对照.doc
- My day 第一课时教学设计.doc
- 2013-2014冀教版小学英语四年级上册期中测试卷5.doc
- 近十几年上海英语高考真题翻译部分.docx
- 2024年九江市九江县地税局招聘6人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年临沂市荣军医院招考聘用合同制工作人员6人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年中铁一局集团限公司生态资源建设分公司招聘【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年中非研究院编制外人员招聘10人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年云南普洱市科学技术馆合同制工作人员招聘历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年云南兰茂星城投资限公司及下属子公司公开招聘25人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年云南丽江市食品药品监督管理局事业单位招聘历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年云南昆明市延安医院专项编制招考聘用13人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年临沂沂水县疾病预防控制中心招考聘用部分劳务派遣工作人员20人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024年丽水市瑞听助听器专业验配中心招考(1人)【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
最近下载
- 救护队预防性检查.ppt
- 新型轻钢装配式复合墙板.pdf VIP
- 2023-2024学年陕西省西安市雁塔区数学三年级第一学期期末考试试题含答案.doc
- 酚醛树脂1.ppt
- 2022-2023年度武汉规划展示馆与两型社会展示馆定稿.pdf VIP
- 煤矿地质学培训教材.pdf
- BS ISO 4864-2023 Ships and marine technology. Jacking system appliances on self-elevating 船舶和船舶技术. 自升式顶升系统设备.pdf
- 【提分专项】闽教版英语小升初总复习-语法部分(B卷有答案).docx VIP
- 空压机工作原理及技术方案.docx
- 人教版(2023版)初中历史八年级上册全册同步练习+单元及期中期末测试合集(含答案)【可编辑可打印】.docx
文档评论(0)