互联网时代的网络自动化运维.pdfVIP

  • 9
  • 0
  • 约6.3千字
  • 约 8页
  • 2020-08-30 发布于广西
  • 举报
互联网时代的网络自动化运维 互联网上有两大主要元素内容和眼球,内容是互联网公司提供的网络服务,眼球则是借指 海量的互联网用户。 AD: 互联网上有两大主要元素内容和眼球,内容是互联网公司(或称ICP)提供的网络服务,如网 页、游戏、即时通信等,眼球则是借指海量的互联网用户。互联网公司的内容往往分布在多个或大 或小的IDC中,越来越多的眼球在盯着ICP所提供的内容,互联网公司进行内容存储的基础设施也 呈现出了爆发式的增长。为了保障对内容的访问体验,互联网公司需要在不同的运营商、不同的省份 /城市批量部署业务服务器用以对外提供服务,并为业务模块间的通信建立IDC内部网络、城域网和 广域网,同时通过自建CDN或CDN专业服务公司对服务盲点进行覆盖。因此随着业务的增长,运维部 门也显得愈发重要。他们经过这些年的积累,逐步形成了高效的运维体系。本文将结合国内互联网公 司的经验,重点针对IT基础设施的新一代自动化运维体系展开讨论。 一、运维的三个阶段 第一个阶段:人人皆运维 在早期,一个公司的IT基础设施尚未达到一定的规模(通常在几台到几十台机器的规模),不一 定有专门的运维人员或部门,运维的工作分担在各类岗位中。研发人员拥有服务器权限,自己维护和 管理线上代码及业务。 第二个阶段:纵向自动化 随着业务量的增长,IT基础设施发展到了另外一个量级(通常在上百台至几千台机器的规模), 开始有专门的运维人员,从事日常的安装维护工作,扮演救火队员,收告警,有运维规范,但运维 主要还是为研发提供后置服务。 这个阶段已经开始逐步向流程化处理进行过渡,运维部门开始输出常见问题处理的清单,有了自 己业务范围适用的自动化脚本,开始利用开源软件的拼装完成大部分的工作。 具体表现为:各产品线有自己编写的脚本,利用如SVN+puppet或chef来完成服务器的上线和配 置管理等工作。 第三阶段:一切皆自动 在互联网化的大潮中,越来越多的黑马团队应运而生,都曾有过短时间内用户访问量翻N倍的经 历。在流量爆发的过程中,ICP的互联网基础服务设施是否能够很好的跟进,直接决定了业务内容能 否满足海量用户的并发访问。 与此同时,运维系统需要足够地完善、高效、流程化。谷歌、腾讯、百度和阿里等规模的公司内 一般都有统一的运维团队,有一套或多套自动化运维系统可供参照,运维部门与开发部门会是相互平 行的视角。并且也开始更加关注IT基础设施在架构层面的优化以及超大规模集群下的自动化管理和 切换(如图1所示)。 图1.大型互联网公司IT基础设施情况概览 二、BAT(百度、阿里、腾讯)运维系统的分析 国内的互联网公司百度、阿里、腾讯(以下简称:BAT)所提供的主要业务内容不同,IT架构不同, 运维系统在发展过程中有不同的关注点。 1.腾讯运维:基于ITIL的运维服务管理 预计到2015年腾讯在全国将拥有60万台服务器。随着2012年自动化部署实践的成功,目前正 在进行自动化验收的工作。在网络设备方面,后续将实现从需求端开始的全自动化工作:设备清单自 动生成-采购清单自动下发-端口连接关系、拓扑关系自动生成-配置自动下发-自动验收。整个运 维流程也已由初期的传统IT管理演进到基于ITIL的服务管理流程(如图2所示)。 图2.腾讯基于ITIL的运维服务管理 2.阿里运维系统:基于CMDB 的基础设施管理+逻辑分层建模 CMDB(Configuration Management Database) 配置管理数据库(以下简称:CMDB),将IT基础架 构的所有组件存储为配置项,维护每个配置项的详细数据,维护各配置项之间的关系数据以及事件、 变更历史等管理数据。通过将这些数据整合到中央存储库,CMDB可以为企业了解和管理数据类型之 间的因果关系提供保障。同时,CMDB与所有服务支持和服务交付流程都紧密相联,支持这些流程的 运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。可实现IT服务支持、IT运维 以及IT资产管理内部及三者之间的流程整合与自动化。在实际的项目中,CMDB常常被认为是构建其 它ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。 3.百度自动化运维:部署+监控+业务系统+关联关系 百度主要面临的运维挑战包括:突发的流量变化、复杂环

文档评论(0)

1亿VIP精品文档

相关文档