- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CCCC信息技术有限公司深圳分公司
运维线上应用与系统监控规范
编号: OI-IT-08
页码/页数: PAGE 1/7
工作文件
版本
A
修订次数
00
修订人
修订日期
2018-9-1
运维线上应用与系统监控规范
2018年9月1日起发布实施
文档修订历史
修订版本
修订日期
作者
审核人
批准人
说明
目 录
TOC \o 1-3 \h \u 简介 4
1.1适用范围 4
1.2服务介绍 4
监控方法及平台 4
2.1 监控原理说明 4
2.2 Pingdom监控平台 4
2.3 Zabbix监控平台 5
2.4 DX MonitorSystem监控平台 5
2.5 例行检查 6
2.6 客户汇报错误 6
2.7 销售数据预警 6
2.8 业务操作环节监控 7
2.9 其他 7
报警及响应说明 7
3.1报警媒介 7
3.2报警级别 7
3.3响应要求 7
附录: 8
简介
1.1适用范围
本文档是运维针对生产环境应用与系统的监控原理及平台说明,报警与响应的总体原则说明及指导规范 。
1.2服务介绍
运维作为网络与服务的运营岗位,一直以来都高度关注和重视数据安全。为保护业务正常运营、数据安全等,我们从技术、服务规范流程等各个方面进行了细致而周密的规范,并严格执行。
本规范旨在通过各种监控技术和平台,提前预警隐患,进行及时处理,避免或减少影响及损失。
监控方法及平台
2.1 监控原理说明
针对生产环境应用及系统的监控从位置划分主要有外部监测和内部检测。外部监测从因特网及客户的角度着眼检测网站页面或者API是否正常;内部检测从内部网络及服务器内部着眼查看站点、程序、服务、及系统是否正常。
从检测深度划分则分为:存活性检测,和可用性检测。存活性检测从最基本的层面查看被关注应用和系统是否正常,例如网站页面是否能正常加载,API服务访问点是否存在,进程及监听端口是否存在,数据库是否可链接等;可用性检测关注应用和系统是否能正常使用,所做的检测往往涉及到具体的参数,如API模拟调用、业务操作环节检测等。
目前运维使用及规划的监控平台及方法主要有:1)Pingdom监控平台;2)Zabbix监控平台;3)DX MonitorSystem监控平台;4)例行检查;5)客户汇报错误;6)销售数据预警;7)业务操作环节模拟;8)内部同事反馈等。
2.2 Pingdom监控平台
Pingdom是外部检测平台,从全球30多检测点以HTTP/HTTPS方式检测页面及API服务是否正常,目前只能做到存活性检测。因为Pingdom的每个检测需要购买,目前针对前台关键站点、API服务访问点、及服务器进行监控。
2.3 Zabbix监控平台
Zabbix是开源的企业级监控方案,以Zabbix Agent + Zabbix Proxy(可选分布式方案) + Zabbix Server + Zabbix Web frontend构建出强大而完善检测平台。目前生产环境及部分本地环境60多台服务器和涉及到的300+应用与系统均以加入到Zabbix监控系统中。平均每个服务器上关联了100+个检测点,40+个报警触发点,和6~8个预定义图表。
Zabbix以常规的系统及应用运行信息检测为主,目前多数检测属于存活性检测。
2.4 DX MonitorSystem监控平台
DX MonitorSystem是对Zabbix的细粒度扩展,同时也是运维工作自动化的支撑平台。DX MonitorSystem由DX MonitorSystem Agent(DMA) + 运维面板组成。
DMA部署在每个服务器上,由总体框架和细分模块组成。总体框架提供与运维面板的信息传递和交互接口。细分模块针对每个组件/模块提供细粒度的信息收集或操作控制。例如GENERAL模块提供在各服务器上获取基本信息接口;Nginx模块提供Nginx反向代理相关信息,并提供改变及控制Nginx反向代理配置方法和接口;IIS模块提供IIS站点细粒度信息收集及常规维护操作接口。
运维面板与DMA结合,主要提供Web方式的操作界面,如获取所有站点Nginx反向代理信息呈现在页面中,并可通过页面就行修改设置。DX MonitorSystem与Zabbix系统关系如下图所示。
图一:DX MonitorSystem与Zabbix结构图
2.5 例行检查
例行检查采用人工方式,通过Zabbix、登陆服务器等方式,查看关注的应用和系统是否正常并进行记录,对于异常情况则提供出问题或通知相应负责人进行处理。
2.6 客户汇报错误
原创力文档


文档评论(0)