阿里hbase高可用之路.pdfVIP

  • 0
  • 0
  • 约1.13万字
  • 约 20页
  • 2023-11-16 发布于北京
  • 举报
HBase – Hadoop Database,是一个高可靠性、高性能、易伸缩的分布 式 系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化 集群。 Ali-HBase基于阿里巴巴本身业务场景和特点,对社区HBase进行深度定 制与改进,从解决方案、稳定护航、发展支撑等全方位提供一站式分布式 NOSQL数据库的产品与服务。 • 高可靠性 • 易伸缩 • 高灵活性 什么是高可用?如何衡量? 可用率:计算机系统有效性的表示,它是在一段相当长的时间内,计算机系统的可用 时间与故障时间,维修时间及可用时间总和的比。 • 请求失败率 • RegionServer宕机比例 Ali-HBase集群的可用率是多少? Ali-HBase集群服务全 900+的应用,全年可用率达到99.99%即全年不可用时间不 超过52分钟。 如何实现HBase集群99.99%的可用率? 节点宕机/大请求 集群不可用 节点宕机、请求热点、GC等情况都会 程序BUG、断网、断电等情况造成单 . 造成应用 报错,影响集群的可用 个HBase集群挂掉,如何保证可用率 性,如何进行优化保证可用率断 单元不可用 情况下,某地域整个单元不 可用,如何保证异地灾备能力 • RegionServer宕机恢复 (00-99) (00-24) (25-49) (50-74) (75-99) Table …... RegionA RegionB RegionC RegionD RS1 RS2 H H L RegionA L RegionB O O G RegionD G RegionC 解决两个问题:(1)Hlog中数据的恢复;(2)Region的再分配。 • RegionServer宕机恢复 检测到RS宕机 检测到RS宕机 rename rs log rename rs log 在zk上给rs上所有regi on建立recover节点 优化 enqueue split task AssignRegions enqueue split task 删除 rs log 删除 rs log AssignRe

文档评论(0)

1亿VIP精品文档

相关文档