- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚美优品:听云应用性能管理与监控系统融合之道
电商行业在中国已经走过很多年头,却依然没有停下迅猛发展的脚步,其中一些垂直领域的
前景和市场仍然可观,例如化妆品电商。作为女性的“必需品”,网购化妆品市场规模一直
都在保持增长,作为国内较早成立并且首个赴美上市的垂直化妆品电商,聚美优品可能经历
整个市场的不断进化,然而对这种变革感触最深的,恐怕要数聚美优品的运维工程师们。
60 亿,只是开始
2013 年时,聚美优品已经成立有3 年之久,在这一年,他的全年销售额突破60 亿元,这是
个很高的数字,然而在聚美优品级运维工程师崔星眼里,这只是个开始。他回忆到,在2013
年聚美优品的监控规模还小于200 台,监控指标只有不到5000 个,而这个数量在短短一年
之内增加 1000 台、五万个指标,当大家都认为这个发展会放缓时,直到今日,聚美优品监
控的指标已经超过了五十万个,架构也从最初的 Nagios + Ganglia 变为了如今的 Zabbix +
CMDB 。
这样的改变是如何发生的?在早期,聚美优品遇到遇到过很多的问题:
1. 监控系统自身水平扩展能力差:没有使用登录式,水平拓展也不是很好
2. 不利于自动化:指标更新很复杂,配臵一个指标,要更改指标项目,监控项目,这
时候需要通过工具批量执行
3. 告警策略的维护:变更代价太大
4. 监控指标展示不太直观
5. 数据采集也不统一
随着公司业务发展的变迁,为了解决问题,聚美优品意识到必须打造一个优秀的监控系统,
而这个监控系统应具备的这样的条件:
强大的数据采集
高效的告警策略
个性化的告警设臵
多维度的数据展示
可水平扩展
最终,聚美优品找到一种新思路,CMDB + Zabbix ,满足优秀监控所具备的条件,最终
成为自己开发的运维开发平台。
在路上,全新的监控平台
我们先来看一下聚美这套全新的监控平台的体系架构图:
阴痋耶
从图中,我们可以看到有很多亮点:
数据采集: Agent 自动发现, 主动推送模式
分布式监控: 监控 Proxy 可持续水平扩展
告警策略人性化:递延报警,报警暂停,按时段发送不同类型告警
Dashboard :多维度数据展示,Top 指标对比等功能
自动管理: 自动清除下限机器,自动更新项目类型
数据采集
在数据采集方面,基础采集项全部采用自动发现,无需配臵,实时从CMDB 抓取项目、
环境、状况等相关信息。拿到这些信息之后,再注册到Server 上面去,Server 有相关的一系
列匹配。与此同时,采用主动模式上报监控数据,大幅度减轻监控Server 端的压力。最后再
禁用远程命令调用,保证安全高效。
告警
针对告警聚美优品做了很多的优化和设臵:
支持维护周期设臵:想告警几天就设臵告警几天,如果不想监控,可以永久关闭;
如果某台机器凌晨五点不想告警的话,可以在这段时间进行关闭。
自定义告警类型:可以通过短信或者邮件告诉我。
告警列表:可以知道究竟有哪些告警现在没有消除,持续了多长时间,可以作为常
阴痋耶
规的考核可以是看持续性问题的观察。
告警分析:通过一些定义很严重的告警,分很多等级,不同的等级可以发送给运维
人员。
告警递延:第一次告警是运维人员,如果运维人员半个小时之后没有处理,告警信
息会上报给开发人员或者是部门主管。
支持告警恢复通知
上面这张就是聚美优品的告警周期维护的截图,我们可以看出设臵告警的时间,一些指
标的查看,问题处理的时候,持续周期,警告时间,运维人员等一系列内容,都可以通过告
警列表去知晓。
Dashboard
一个监控系统的好坏,很大程度上要看展示板的功能如何,聚美优品的展示板就是他们
的特色之一:
项目指标聚合展示:将业务中一些比较重要的内容做展示,例如有20 台机器的数
文档评论(0)