大型电商网站的网络运维实践.pdf

大型电商网站的网络运维实践 王大泳 2015年4月 京东增长 2 遭遇问题 在过去的两年里 京东网络遇到哪些问题? 网络团队是如何思考和处理的? 3 1美元和9999美元的故事 1923年,美国通用电气公司发生一起非常棘手 的电机故障,多方解决无果后,受邀前来的斯 坦梅茨只在电机外壳用粉笔画了一条线并要求 减少相应位置的16条线圈后,故障神奇的解决 了。 让人吃惊的是,通用电气为此向斯坦梅茨支 付了10,000美元的费用。 面对人们对天价收费的不解和指责,斯坦梅茨 给通用电气寄回了一张账单: 4 发展阶段 知道 遇到 料到 做到 5 遭遇问题 • 内网故障,井喷趋势 • 公网问题,接二连三 • 网络脆弱,风吹草动引发大事故 • 着手分析,却缺少有效的数据和工具 • 网络团队,忙于救火 • 不除根因,恶性循环 •业务发展迅猛,时不我待 6 措施一:监控 措施:网络监控 措施:网络架构 7 监控 - 目标 要知道 • 整体网络是否正常 • 发生应用故障时,涉及的局部网络有无异常 • 出现网络问题时,具体现象和影响 • 关键网络服务的性能、负载、容量 8 监控 - 目标 要做到 • 一目了然地查看网络的整体运行情况 • 便捷地查看任意时间的流量统计 • 便捷地查看任意时间的网络质量和连通性 • 可以回溯网络日志和关键链路的流量成分 9 监控 - 整体情况 10 监控 - 整体情况 一目了然:公网出口、专线 •带宽、带宽使用率、in/out流量 、流量涨幅、接口up/down •合计 •可进行条件过滤,异常阈值设置 ,只显示异常信息等 方便快捷 •列出关键网络设备清单,一键进入设备明细页面 •一键进入常用流量统计报表、常用工具等页面 11 监控 - 设备明细 这是一个即将下线的接入交换机:

文档评论(0)

1亿VIP精品文档

相关文档