基于 zabbix 系统监控 系列1-zabbix 简介 与 windows 系统监控.doc

基于 zabbix 系统监控 系列1-zabbix 简介 与 windows 系统监控.doc

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
? ? ? ? ? ? ? ? 基于 zabbix 系统监控 系列1——zabbix 简介 与 windows 系统监控 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 1 介绍 1.1 摘要 基于 zabbix 系统监控:简介 zabbix 基本概念及其特点,阐述 zabbix 系统环境搭建与基础安装,实现对各类操作系统、硬件设备、应用软件监控告警的说明文档。 本文深入浅出,切近实际运维应用,由 zabbix 3.4 版本入手,学习 zabbix 监控告警实现方式,由 zabbix 5.0 浅出实现快速部署、快速应用。本人从业多年,关注 zabbix 开源社区,以及 zabbix 官方组织的各种峰会,了解到的前言技术,因随着运维监控软件的不断发展,未来软件将是开箱即用的模式,运维人员在使用监控软件,不必再去花精力编写运维监控程序,而是完善监控项,这样的方式对于初学者越来越不容易学习。因此,学习 zabbix 3.4 版本是非常必要的, zabbix 官方那时候还没有集成更多的模板以直接使用,那里有大量的监控项需要自己编写实现,不仅全面了解了 zabbix ,也是对 linux 命令、 shell 脚本、 Python 语言等的很好学习,也有助于二次开发,自定义监控项的配置。 因本人目前就职于某家车企,车辆网平台的监控选用 prometheus+grafana , prometheus 与 zabbix 选用哪个更好呢,因其具有各自特点,对于选择而言也许就是仁者见仁智者见智,车联网监控又具备哪些特点呢,在后期文档中也会补充 prometheus+grafana 监控系统。 1.2 背景 以下是部署实施基于 zabbix 监控系统的建设背景,以解决诸多运维实际问题: 目前公司系统运维主要采用人工检查的方式,问题发现的时效性较低,容易出现问题不被立刻发现,人工也容易疏忽漏查,导致问题处理不及时,影响信息化系统服务效果,就需要更好保障系统稳定运行。 公司信息化系统、操作系统、设备种类多,各类信息化系统如: OA 、 U9 , PLM 、企业邮箱等,又有 linux 、 windows 、 Vmware 、 EMC 等系统,设备有服务器、交换机、存储等,机房环境有动环系统进行监测。如此众多的信息化系统平台,当然需要统一运维界面,实时监测各系统运行状况,为运维工作提供便利。 为适应时代的发展,未来是个智能化的时代,运维工作要实现自动化,运维工作者要向开发去转变,开发即运维,或许有一天人工智能将代替运维人员,而今的运维人员希望是人工智能创造者的一份子,了解自动化运维,与时俱进是非常必要的。 ??综上,为了提高运维效率,节约人力资源,对设备、机房环境实时监控,能有效、实时发出告警信息,从而及时发现问题快速响应。急需一套能满足以上需求的监控系统,经考量 zabbix 监控系统应用广泛,可实现上述功能。 1.3 系统简介 Zabbix 是一个企业级解决方案,支持实时监控数千台服务器,虚拟机和网络设备,采集百万级监控指标。 Zabbix 完全开源免费。 Zabbix 的主要特点有: 指标收集:从任何设备、系统、应用程序上进行指标采集 问题监测:定义智能阈值 可视化:单一界面管理平台 告警和修复:确保及时、有效的告警 安全和认证:保护您所有层级的数据 轻松搭建部署:大批模板,开箱即用,节省您宝贵的时间 自动发现:自动监控大型动态环境 分布式监控:无限制扩展 ZABBIX API :将 Zabbix 集成到您 IT 环境的其他任何部分 1.4 名词术语 Zabbix 系统有一些自己定义的专业术语,为更好的熟悉系统名词,下面主要介绍本文以及 zabbix 常用的术语。 主机( host) 一台你想监控的服务器、工作站、交换机等网络设备,用 IP 或者域名表示。 主机组( host group) 多台具有某种相同角色、属性的集合。例如,所有 windows 服务器放在一个叫 “windows server” 的主机组中。 监控项( item) 你想要监控、获取主机或主机组的哪些数据。例如:我想监控所有机器的 CPU 使用情况,则需要建一个监控项,用于获取所有服务器的 CPU 使用率。 触发器( trigger) 由逻辑表达式组成的按照预先设置好的阀值来评估由监控项采集到的数据。触发器有两种状态,分别为 “ 问题 ” 和 “ 已解决 ” 。例如:在上述通过监控项获取了 CPU 的使用率,假如我想超过 CPU 使用超过 80% 的就预警,则可以创建一个触发器,当监控项获取的值超过 80% 时就按照预设的情况报警,状态为 “ 问题 ” ;低于 80% 时认为报警解除,状态恢复为 “ 已解决 ” 。 事件( event

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档