- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
品高云监控预警体系初探?| 品高云公开课
小编的话
“品高云公开课”系列文章意在分享技术牛人的知识干货,和大家一起交流学习云知识,每期主题都不一样哟!期待各位读者在文后发表留言,来一场技术上的交流和思想上的碰撞!2016年7月27日本期品高云公开课,由李志伟带来“品高云监控预警体系初探”的分享。
分享嘉宾
李志伟目前就任品高广州云架构产品部 BingoCloud平台软件开发工程师,从事云平台开发工作7年,熟悉云平台整体架构,参与多个云服务,如EC2、ELB、CW、AutoScaling、SNS等的开发。
分享正文
有人说,云计算拼的就是运维能力。随着云平台规模的不扩大,运维的难度也呈直线上升,云平台的监控预警系统变得越来越重要。
提到监控预警系统,很多人的第一反应就是:可通过各种图表查看各个监控项的状态;可对监控项设置警报,达到一定阀值时告警,能通过邮件、短信等方式通知到管理员,等等。
这些确实是大多数监控系统的基本功能,但对于传统的监控系统,更倾向于发现问题,通知管理员处理。在云计算的时代,监控能否做得更多呢?下面我将为大家介绍一下品高云的监控系统。
品高云作为一个自主研发的,遵循亚马逊接口标准的云平台,其监控系统也不例外。品高云的监控系统,即云监控服务,在兼容亚马逊CloudWatch接口的基础上,作了大量的优化与扩展,方便管理员和用户的使用。
作为监控系统,首先要确定监控的内容,即监控指标。每一种云资源都会有内置的一些监控指标,如实例的CPU使用率、网络I/O;存储卷的磁盘I/O,读写操作数,等等。
管理员可查看、管理云平台的各项监控指标。
(图: 监控设置)
如果云平台内置监控指标不能满足需求,怎么办呢?没关系,我们支持自定义监控指标。只需要按要求撰写好数据采集脚本、新建监控指标即可。
下面以监控MySQL连接数为例,展示如何在品高云监控服务自定义指标:
1. 撰写数据采集脚本,并由管理员上传到云平台指定目录:
(图: 脚本)
2. 新建监控指标,填写相关参数:
(图: 新建指标)
数据采集脚本是在哪里运行的呢?这与监控指标的设置有关。监控指标的收集方式包括ec2config和controller。
ec2config是内置在云平台镜像里面的一个程序,可与云平台交互,实现更多的功能。收集方式选择ec2config,即是由该程序在实例内部运行采集脚本,并通过特定的URL汇报到云平台。
controller,即由云平台物理机运行采集脚本。
自定义监控指标默认都通过ec2config采集数据。
定义好监控指标,云平台便会根据设定定时去收集、汇总数据。我们可以到各个资源的详情页面,查看该资源相关指标的监控数据。
(图: 监控图表)
有监控数据只是第一步,我们要如何利用这些数据去完成更多的操作呢?答案就是:监控警报。
对于亚马逊CloudWatch,一个监控警报只对应一个云资源的一个监控指标;如果想监控100个实例的CPU使用率,必须重复建100遍。
品高云对此作出改进,将监控警报拆分为警报定义跟监控项。警报定义包括警报类型、触发条件、触发操作等通用定义,与具体云资源无关。
(图:新建警报)
如果警报类型选择的是任意实例、任意主机,则无需其他操作,警报自动对所有实例、主机(包括后续新建的)生效。
如果不是针对任意资源的警报,则还需要创建监控项,选择具体需要监控的资源,绑定到相关的警报。
(图: 新建监控项)
新建监控项时,还可以定义触发操作。要注意的是:定义在监控警报的操作是通用的触发操作,所有绑定到该警报的资源都会触发;定义在监控项的操作则只对该监控项对应的资源生效。
监控警报能触发的操作,目前主要包括三种:
1. 平台消息: 警报触发后,往云平台发送消息,用户登录时可以看到。
(图:平台消息)
2. 发送SNS主题: SNS即云平台的另一个服务:简单通知服务。用法是:根据需要创建一个SNS消息主题,当监控警报触发时,将向该主题发布消息。
一个SNS消息主题可以添加多个消息订阅。订阅方式可以是Email、Email-JSON或HTTP。当有人向消息主题发布消息时,所有已确认的订阅者都能收到消息。
如果是Email、Email-JSON的订阅者,将收到邮件通知;如果是HTTP订阅者,将收到POST请求(消息内容为JSON格式),用户可根据需要作进一步的处理。
(图:SNS订阅)
3. 触发弹性策略: 弹性策略与云平台另一个服务:弹性伸缩服务有关。
弹性伸缩服务可以让用户创建弹性组,通过指定启动配置(包括使用的镜像,网络,是否使用负载均衡),最小、最大及当前需要的实例个数等来创建一组云资源。
服务本身会对实例进行健康检查,确保健康的实例数量达到设置的需要值; 通过定义弹性策略加、减实例,再与云监控服务结合,达到通过监控数据的变化
您可能关注的文档
最近下载
- 餐饮值班管理课程培训.pptx
- 尔雅《批判与创意思考》课后习题+期末试题.docx VIP
- 6-4正奇租赁二期资产支持专项计划现金流预测分析报告1213日.pdf
- 算法设计与分析(北航)中国大学MOOC慕课 章节测验期末考试客观题答案.docx
- 2024年山东省济宁市中考化学试卷(附答案).docx VIP
- T IAC CAMRA 50-2024 《事故汽车常用零部件修复与更换判别规范》(2).pdf
- 北师大版数学八年级下册第六章 平行四边形 大单元整体教学设计学历案教案附作业设计(基于新课标教学评一致性).docx
- 长江经济带港口发展研究(2011~).docx VIP
- 染色技术 8.1 涤纶结构特点和分散染料分类 8.1 涤纶结构特点、分散染料分类.pptx
- 人教版三年级下册必读书目《中国古代寓言故事》 .pdf
文档评论(0)