百度智能运维实践异常检测.pdf

百度智能运维实践 :异常检测 王博、姚睿尧、潘成龙 百度运维部 目录 • 背景 • 异常检测 • 时序数据存储 • 时序数据采集汇聚计算 AIOps智能运维解读 • Gartner 的解读 • 百度的实践 – Big Data + Machine Learning 驱动 – 智能化 :运维策略库 – 三大场景 : – 数据化 :运维知识库 • Automation – 工程化 :运维开发框架 • Monitoring • Service Desk – 典型的几个运维场景 : • 故障处理 • 客服咨询 • 部署变更 • 容量管理 Source :Gartner Report IT Operations Analytics Must Be Placed Within an AIOps Context. Will Cappelli (Research VP) | 26 August 2016 监控是服务高可用的基础 重大有损故障 复盘分析 OP 解决的故障 止损定位 OP 接收的报警 筛选分发 发送的报警通知 合并去重 异常事件生成 异常检测 监控数据 百度智能监控系统全景 数据存储 可视化 采集 聚合计算 异常检测 报警 异常检测 目录 • “异常检测”的挑战 • 通用异常检测介绍 – 累计恒定阈值 – 突升突降 – 同比算法 • 算法选择决策树和参数智能配置算法 “异常检测”的挑战 • 数据规模大 :百万级指标 • 异常检测需求差异明显 – 业务类型 :搜

文档评论(0)

1亿VIP精品文档

相关文档