- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网易视频云HBase最佳实践列族设计优化.doc
网易视频云:HBase最佳实践一列族设计优化
网易视频云是网易倾力打造的一 ?款基于云计算的分布式多媒体处理集群和专业咅视频技 术,力客户提供稳定流畅、低时延、高并发的视频直播、录制、存储、转码及点播等音视频 的PaaS服务。在线教育、远程医疗、娱乐秀场、在线金融等各行业及企业用户只需经过简 单的开发即可打造在线音视频平台。现在,网易视频云与大家分享一下HBase最佳实践一 列族设计优化。
随着大数据的越來越普及,HBase也变得越来越流行。会用HBase现在已经变的并不 困难,然而,怎么把它用的更好却并不简单。那怎么定义‘用的好’呢?很简单,在保证系统 稳定性、可用性的基础上能够用最少的系统资源(CPU,IO等)获得最好的性能(吞吐g:, 读写延迟)就是’用的好’。HBase是一个庞大的体系,涉及到很多方面,很多因素都会影响 到系统性能和系统资源使用率,根据场景对这些配置进行优化会很大程度上提升系统的性能。 笔者总结至少有如下儿个方面:HDFS相关配置优化,HBase服务器端优化(GC优化、 Compaction优化、硬件配置优化),列族设计优化,客户端优化等,芄中客户端优化在 前妞己经通过超时机制、重试机制讲过,后笔者会继续分別介绍其他三个优化重点。
本节重点介绍列族设U?优化,HBase中基本属性都是以列族为单位进行设置的,如下 示例,用户创建了一张称为‘ NewsClickFeedback1的表,表中只有一个列族’Toutiao’,紧接 着的属性都是对此列族进行的设置。这些属性基本都会或多或9地影响该表的读写性能,但 有些属性用户只需要理解其意义就知道如何设置,而有些属性却需要根据场景、根据业务来 设貫,比如BLOCKSIZE属性在不同场景下应该如何设賈?还有COMPRESSION属性和 DATA_BLOCK_ENCODING属性,两者都可以提供压缩功能,那到底应该选择哪个,还是 两个都需要进行设置?本文就重点介绍这三个属性的设计原则。
create ?New5ClickFeedb?ck\{NAME-,Toutiao\V5RSIONS-l,BLOCKCACHE-tPue,BLOO?-1FILTER=
ROW,,COf-1PRESSION-,SNAPPY*,TTL ■ *259200*, DATA BLOCK ENCOOING ■ ?PREFIX TREE*, BLO CKSI2E ? ,65536,}J{SPLITS ?
BlockSize 设
块大小是HBase的一个重要配置选项,默认块大小为64M。对于不同的业务数据,块大小 的合理设置对读写性能有很大的影响。而对块大小的调整,主要取决于两点:
1.用户平均读取数据的大小。理论上讲,如果用户平均读取数据的大小较小,建议将块大 小设置较小,这样可以使得内存可以缓存更多Wock,读性能自然会更好。相反,建议将块 大小设置较大。
为了更好说明上述原理,笔者使用YCSB做了一个测试,分别在Get、Scan两种场景下测 试不同BlockSize大小(16K, 64K, 128K)对性能的影响。测试结果分别如下面两图:
BlockSize对随机读(Get)性能影响曲线图
随着BlockSize的增大,系统随机读的吞吐量不断降低,延迟不断增大。64K大小比16K 大小的吞吐量大约降低13%,延迟增大13%。同样的,128K大小比64K大小的吞吐量降 低约22%,延迟增大27%。因此,对于以随机读为主的业务,可以适当调低BlockSize的 大小,以获得更好的读性能。
BlockSize对区间扫描(Scan)性能影响曲线
2520151050
25
20
15
10
5
0
随着BlockSize增大,scan的苍吐量逐渐增大,延迟不断降低。64K大小BlockSize比16K 大小的吞吐量增加了 33%,延迟降低了 24%; 128K大小比64K大小吞吐量增加了 7%, 延迟降低了 7%;因此,对于以scan为主的业务,可以适当增大BlockSize的大小,以获 得更好的读性能。
可见,如果业务请求以Get请求为主,可以考虑将块大小没置较小;如果以Scan请求为主, 可以将块大小调大;默认的64M块大小是在Scan和Get之间収得的一个平衡。
2.数据平均键值对规模。可以使用HFile命令查看平均键值对规模,如下:
./hbase org.apache.hadoop.hbase.io.hfile.HFile -m -f /hbase-sc/data/news/HewsClickFeedb
ack/627bld95153d4157351b65135ab701a3/Toutiao/011b41375e58453ea24a3a203b9cela3
Clock index size
您可能关注的文档
最近下载
- 党纪学习教育课件_2024中国共产党纪律处分条例解读PPT_新修订条例党课含配套讲稿.pptx VIP
- 2024年四川省成都市武侯区中考语文二诊试卷.doc VIP
- 各类架空导线参数大全(电阻、感抗、容抗)2021.xls VIP
- 湖南师大附中2026届高三月考试卷(五)英语试题(含答案详解).doc VIP
- 铲车班班组安全例会培训课件.pptx VIP
- 图形化编程-排序之冒泡排序(课件)2025-2026学年编程通用版.pptx VIP
- 六年级树莓派机器人编程课+8拼手速游戏2(课件).pptx VIP
- DCDC原理.pdf VIP
- 六年级树莓派机器人编程课+6自制音乐盒(课件).pptx VIP
- 机房运维年终总结PPT.pptx VIP
原创力文档


文档评论(0)