- 0
- 0
- 约1.13万字
- 约 20页
- 2023-11-16 发布于北京
- 举报
HBase – Hadoop Database,是一个高可靠性、高性能、易伸缩的分布
式 系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化
集群。
Ali-HBase基于阿里巴巴本身业务场景和特点,对社区HBase进行深度定
制与改进,从解决方案、稳定护航、发展支撑等全方位提供一站式分布式
NOSQL数据库的产品与服务。
• 高可靠性
• 易伸缩
• 高灵活性
什么是高可用?如何衡量?
可用率:计算机系统有效性的表示,它是在一段相当长的时间内,计算机系统的可用
时间与故障时间,维修时间及可用时间总和的比。
• 请求失败率
• RegionServer宕机比例
Ali-HBase集群的可用率是多少?
Ali-HBase集群服务全 900+的应用,全年可用率达到99.99%即全年不可用时间不
超过52分钟。
如何实现HBase集群99.99%的可用率?
节点宕机/大请求 集群不可用
节点宕机、请求热点、GC等情况都会 程序BUG、断网、断电等情况造成单
. 造成应用 报错,影响集群的可用 个HBase集群挂掉,如何保证可用率
性,如何进行优化保证可用率断
单元不可用
情况下,某地域整个单元不
可用,如何保证异地灾备能力
• RegionServer宕机恢复
(00-99) (00-24) (25-49) (50-74) (75-99)
Table …... RegionA RegionB RegionC RegionD
RS1 RS2
H H
L RegionA L RegionB
O O
G RegionD G RegionC
解决两个问题:(1)Hlog中数据的恢复;(2)Region的再分配。
• RegionServer宕机恢复 检测到RS宕机
检测到RS宕机
rename rs log
rename rs log 在zk上给rs上所有regi
on建立recover节点
优化
enqueue split task AssignRegions
enqueue split task
删除 rs log
删除 rs log
AssignRe
原创力文档

文档评论(0)