系统监控体系搭建部署.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

系统监控体系搭建部署

背景

当前环境内对各项服务指标监控粒度不到位,服务报警、系统报警、负载报警混杂在⼀个报警群

中,优先级⾼的报警经常性的被优先级较低的报警所覆盖容易导致运维或其他值班⼈员⽆法及时看

到报警信息并导致⽣产或其他环境产⽣事故

待办

•建⽴监控平台完善监控⼤盘更直观、及时的观察服务、系统、及中间件的性能指标

•建⽴报警规则并正对报警规则划分等级更细粒度的对性能指标进⾏报警

•报警群分类尽可能的避免重要告警的信息覆盖或遗漏

•开发运维消息平台对接监控平台内部开发消息发送平台对接钉钉群

•建⽴报警等级响应制度对报警等级按照优先级进⾏响应处理

监控系统prometheus调研

Prometheus的主要优势有:

•由指标名称和和键/值对标签标识的时间序列数据组成的多维数据模型。

•强⼤的查询语⾔PromQL。

•不依赖分布式存储;单个服务节点具有⾃治能⼒。

•时间序列数据是服务端通过HTTP协议主动拉取获得的。

•也可以通过中间⽹关来推送时间序列数据。

•可以通过静态配置⽂件或服务发现来获取监控⽬标。

•⽀持多种类型的图表和仪表盘。

Prometheus的组件

Prometheus⽣态系统由多个组件组成,其中有许多组件是可选的:

•PrometheusServer作为服务端,⽤来存储时间序列数据。

•客⼾端库⽤来检测应⽤程序代码。

•⽤于⽀持临时任务的推送⽹关。

•Exporter⽤来监控HAProxy,StatsD,Graphite等特殊的监控⽬标,并向Prometheus提供标准

格式的监控样本数据。

•alartmanager⽤来处理告警。

•其他各种周边⼯具。

其中⼤多数组件都是⽤Go编写的,因此很容易构建和部署为静态⼆进制⽂件。

Prometheus的架构

Prometheus的整体架构以及⽣态系统组件如下图所⽰:

PrometheusServer直接从监控⽬标中或者间接通过推送⽹关来拉取监控指标,它在本地存储所有抓

取到的样本数据,并对此数据执⾏⼀系列规则,以汇总和记录现有数据的新时间序列或⽣成告警。可

以通过Grafana或者其他⼯具来实现监控数据的可视化。

Prometheus适⽤于什么场景

Prometheus适⽤于记录⽂本格式的时间序列,它既适⽤于以机器为中⼼的监控,也适⽤于⾼度动态

的⾯向服务架构的监控。在微服务的世界中,它对多维数据收集和查询的⽀持有特殊优势。

Prometheus是专为提⾼系统可靠性⽽设计的,它可以在断电期间快速诊断问题,每个Prometheus

Server都是相互独⽴的,不依赖于⽹络存储或其他远程服务。当基础架构出现故障时,你可以通过

Prometheus快速定位故障点,⽽且不会消耗⼤量的基础架构资源。

•通过各个exporter对系统、服务、中间件性能进⾏直观监控并输出标准接⼝及监控值

•通过grafanadashboard能够帮助运维或其他研发同学更直观的观察现在及过去服务的运⾏情况

•细粒度的报警规则能够更好的帮助⽣产减轻或避免事故的发⽣

文档评论(0)

易油科技首席架构师 + 关注
实名认证
服务提供商

精通系统架构设计,能够设计可扩展、高效、安全的系统。 面对复杂问题时,能够运用创造性思维找到解决方案。 带领团队落地多个大型项目。

1亿VIP精品文档

相关文档