- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
word完美格式
精心整理 学习帮手
优维科技EasyOps彭鲤航:运维自动化实践
1、运维的趋势与挑战
先说说目前的运维的一些变化。首先,从运维的职能来看。只要干好一件事就可以,那就是让我们管的机器,或者业务能够一直正常运行,只要它不故障,基本就没有运维的事了。但如果出了异常,不管什么事都会有我们的责任,这就是运维。为了做好运维,需要关注的事情很多很广。从能力维度来看,我们需要关注运营产品的质量,效率成本。从产品的生命周期过程来看,我们需要关注发布前、发布中和发布后的整个过程。其次,从运维服务的发展趋势来看。很多年前我们经常非常会YY一下,我们在腾讯所做的运维优化和支持是不是可以打包成服务或解决方案去支持商业用户,当年觉得是异想天开。但随着云计算的出现,大家可以看到,现在上面已经有很多的服务,其实就运维所做的优化和提供的服务。运维的价值不断地从内部向外去传递。运维能力的建设也越来越受到企业的重视。
最后,来看看运维能力的发展趋势。这里我列出了腾讯互联网运维团队所经历的三个阶段。最早的时候运维只要关注各种底层的东西,如服务器、网络、交换机等,把安排的事情干完就可以。但随着你业务规模做大,需要做的事情就没那么简单,不但要把事情做了,还得做得快,做得好,这就需要有能力平台的积累。通过运维平台,一方面是把我们好的、正确的经验积累下来,二是能够通过平台把我们的工作变得更可靠、更高效。当平台建设达到一定的水平之后,就进入到了第三个阶段,即数据分析和云计算的阶段,在目前大数据分析能力快速发展的情况下,数据的价值不断地被大家发现和有效利用。运维作为数据的直接管理人,我们可以在数据的层面上去挖掘很多的价值,尤其是在服务优化和成本优化等方面,运维可以通过把有价值的数据实时采集和分析出来,并反馈给研发、产品团队,来推动产品的不断优化。从这个角度来看,这里有很多的挑战,比如说云计算带来的一些新技术,对人能力的要求。这些不同的新开源组件,新的技术,新的方法,都会对传统的运维工作带来变革的要求。甚至今天主题提的分布式存储,分布式架构,各种新的架构方案和技术的流程也对运维工作带来很多冲击,这些都是需要我们去面对,去变革的。
举个例子,我刚到腾讯的时候,腾讯有一个很奇怪的面试官,叫通道委员会。他反复问我什么是ITIL,那个时候完全不懂,大家做运维的应该没有人不熟悉这个东西了。以前流行通过ITIL,通过流程的理念来管理IT系统。这东西虽然有用,但运维来说非常的烦人,它会设定没多的门槛和流程,其实这里面很多是不科学的。比如,我们以前要求做故障单管理,故障修复完一定要关闭故障单,我故障早都已经恢复完了,但系统总是记录我忘记结单,处理超时。为了关闭事件单,我就需要浪费额外 的时间去登陆系统,去手工关闭流程。这种时间上的浪费,当你维护的系统变大的时候,效率的损失就边得很可怕了。所以ITIL的管理理念现在已经不流行了。现在大家都讲DEVOPS,提研发、测试和运维的协同。以前ITIL讲分工,发布就是运维的责任,现在DEVOPS强调协同,发布就都让研发去做了。这样很合理,因为程序发布这事你让运维去负责,其实大部分情况下出了问题运维根本识别不出来,你说别人写的代码到底有没有问题我怎么知道,真出了问题,耽误了时间,最后事情还是得交由开发来定位和处理。而DEVOPS重视的就是高效,整个团队协同去处理这个事情,什么样的模式或什么样的人去做这个事情会变得更高效,谁就是第一责任人,我们就让他去负责,这样团队的流转就更高效和科学了。这是理念上的一些变革。对应这些变革,运维人员的能力要求也有所变化。以前我们搬搬服务器,写个脚本什么的就可以了。但是随着技术和管理理念的变化,现在不一样了,运维也要开始写代码了,JAVA、PYTHON、C++什么的。运维在公司的角色定位也不太一样了,以前就只是任务实施,现在慢慢朝平台建设,甚至朝运营分析方向转变。我们不但要有能力写代码还得有能力和研发一起讨论架构,和产品进行运营沟通。真要想把运维做好,你要学的东西太多了。对于各种新技术的学习、应用和融合,如果说每个公司或每个运维都要去重头开始琢磨,那成本会非常大,对人的要求也会非常高。
2、平台建设理念
刚才提了很多挑战和趋势,总的来说,如果我们要去做一个运维平台,去解决运维遇到的这些问题和挑战,我们要怎么做,怎么样才能够把运维的能力通过平台去不断地提升?我这里给了一些自己的想法,这些也是我们在腾讯这么些年积累下来的经验。首先想讲的是平台建设的理念。很多时候做事情时,事情背后的理念往往会比做事情的方法会更重要,不知道大家认不认同这一点。技术人员特别容易
文档评论(0)