- 2
- 0
- 约小于1千字
- 约 30页
- 2026-05-29 发布于北京
- 举报
系统高可用技术架构设计;;云平台的高可用需求;?? 如何保证基础平台的稳定性
?? 如何监控业务和快速恢复
?? 在升级过程中如何保证业务的连续性;16/11/2;整体架构;;;;应用层协议栈/转发面
??网络故障不会导致主机宕机
??利用DPDK实现高性能报文处理
??应用层支持主备切换确保业务连续性;边界集中路由(南北向)
??虚拟路由器之间使用keeplive的方式
??虚拟路由器SESSION同步
??备选节点重选择;;支持数据的多副本
??防止物理故障导致数据丢失
支持快速修复
??只修复副本间差异数据
磁盘检测
??SSD寿命预测
??坏道告警
无元数据中心
??避免存在单点故障;防止脑裂:仲裁机制
??增加元数据副本,作为仲裁者
??只有在超过1/2副本数在线,才允许读写
端到端数据校验
??解决静默错误的数据损坏
??解决软件异常导致的数据损坏
数据自愈
??第一时间修复可能的数据异常;;虚拟机备份(1);;16/11/2;16/11/2;主机级别的监控
??主机的keepalive,保证主机宕机及时发现;
??对主机的CPU,内存,网络,磁盘监控;
??对外置存储和分布式存储状态监控。;虚拟机监控;虚拟网络监控(1);;虚拟存储监控;;升级系统的设计
模块化设计,使得每个模块可以独立升级
升级过程允许新旧两个模块同时工作、平滑替
原创力文档

文档评论(0)