14亿在线背后的故事.pptVIP

  • 2
  • 0
  • 约6.72千字
  • 约 40页
  • 2017-02-16 发布于重庆
  • 举报
14亿在线背后的故事

只在一个IDC内是没前途的 本页不展开各种模式的具体含义,只说需要达到什么目标。具体模式的含义后面几页说。 详细解释 CPU100%的故事:一个小特性没写好代码,100% CPU,收到用户投诉才发现异常 CPU100%的故事:一个小特性没写好代码,100% CPU,收到用户投诉才发现异常 这是后台监控系统上截取到的两个示例图,我们对各个维度、各种指标都有监控和告警 这是QQ群消息量的一天曲线,中间有个飙升。从时间上猜猜和什么事情有关系? 2008年8月18日 刘翔退赛后,群下发消息量 一个图,有最大值、最小值、波动值报警 一个子系统的监控视图,包括了数百个上一页的图片 整个IM后台,有上千个视图 总共,有十万个以上的图片和报警 Grandy的故事:grandy修改配置表,要先写好where子句再写前面的语句。 服务可用性从原来的2个9提升到了4个9接近5个9,与google同级。 略讲,强调两套、有容灾指挥中心,且在两个IDC 问题分析和解决(3) 监控机制原始、报警设置不全,出事了都不知道 CPU 100%的故事 解决方法 完善监控和报警 完善监控和报警 完善监控和报警 完善监控和报警 完善监控和报警 完善监控和报警 问题分析和解决(4) 运维操作通过vim或者mysql进行,非常容易失误 Grandy的故事 解决方法 运维操作Web化(半自动化)、自动化

文档评论(0)

1亿VIP精品文档

相关文档