- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【AWDC】云计算维之“轻”与“重-张颖杰
阿里集团技术保障总监张颖杰:云计算运维之“轻”与“重”我是来自阿里巴巴集团技术保障总监张颖杰,也是想借今天这个机会给大家尽量介绍一下幕后的东西,因为看到幕前是各种各样的产品,但是在幕后怎么样去支撑这个体系,一会儿我介绍一下。首先感谢大家,从运维的层面来讲,我们尤其感谢很多客户的包容和信任,我们运维努力在做,但是还是很多在云计算工作中遇到的挑战,感谢这么多用户对我们一路过来的帮助和包容。先解释一下这个题目,为什么这个题目叫云计算运维之轻与重。从两本书介绍一下,一本书是《生命中不能承受之轻》,《IT不再重要》。《IT不再重要》这本书很著名,我是从09年年底到10年年初开始介入到这个里面,云计算跟我们的传统网站运维有什么不同,我也去寻找资料,那时资料很少的。真正把云落地到一个很形象的,能让大家读懂的很少。《IT不再重要》这本书大家可以去找找,这个题目可能让大家有点费解,当你读过这本书就会明白,是说我们以后有了云计算后,我们的云计算资源就像现在的水和电这个资源一样,站在客户角度就是轻运维。基于系统的、硬件的、流程的各种运维内容的轻和重,是站在不同的视角去看。《生命中不能承受之轻》,他说人很容易在你不知不觉的情况下很浮躁(媚俗),你有时候会因为这种浮躁压得不能承受。我们去推云计算服务的时候,我们是不是能够把云计算能够切实落地下来,就运维而言落地是什么,云计算的运维的高可用,对用户来讲数据永不丢失,这句话说很容易,如何实现,我觉得是抛弃浮躁,落地的过程。站在用户的角度,也就是站在开发商的角度,核心竞争力是开发和运营自己的产品,这是你的市场生命力所在,而产品背后背后是一朵云。真正在实际工作中你可能不用去了解云背后的内容。我们揭开谜底,云后面藏着哪些内容,我这边是很通用性例举一些典型内容和角色。你筹备运维一个网站,既有人力筹备,也有物质筹备。我们不能服务器摆在一个YY的地方就可以提供服务了,我们需要租用IDC,然后租用机架,还要租用带宽,我们还要考虑互联互通等问题,这些其实都需要一个专业的IDC团队去评估和谈判。你得去买服务器,然后买网络设备,买存储设备,要买各种各样的安全产品。这里面也需要有专门的采购团队跟供应商、运营商、代理商去谈IDC有了,服务器有了,然后如何安装部署,要把几千台机器如何搭建出来,这几千台机器平均一年有4%的硬盘损坏,这些硬盘损坏的过程中你怎么样维护,这需要一套运维体系和专业团队完成。还有容量管理,大家在谈云的时候,成本优化是云的卖点,怎样充分的利用共享的资源,把CPU等资源充分的利用起来,实际上这里面有很多容量上的规划。上面是做的事情,底下是对应的有哪些团队实现。比如说负责IDC的,负责采购的,负责各种各样运维任务的工程师,包括IDC工程师,PE工程师,SA工程师,安全工程师等。角色之重,各种各样的工程师、专家,他们做什么呢,这里有张图,可以形象表示工程师的角色关系。比如PE是产品运维工程师,负责保障一个应用产品,其中云计算平台要专门有懂云计算的工程师去维护,这个是平台PE。NET OPS是负责网络的工程师。SCM进行版本管理。SPI是负责流程优化工程师。规模之重,举个例子,第一张照片,是我们在某一个IDC入住之前的样子,就像毛坯房;第二张是建成完之后样子,这是一个局部图,把机器、机架都建起来。再看底下,这个是我们整个支撑运维的团队,大家可以想象我们要做这么多事情,其实需要非常细的专门人才包括DBA,网络工程师,系统工程师,这么人要做的事情,就是保证运维体系的一个正常运转。谈下组织保障,我们现在有接近四五百人的规模来做运维保障,集团一个大运维团队,我们运维在组织结构是划分到集团的,是集团的一个公共团队,来支持各个产品线的运维工作。护航小组,我们这个团队的划分,基本上按照工作的职能,垂直的组织团队划分。但是为了保证某一个重要的产品,我们又有横向组织,这就是护航小组。例如,我们从5+项目的启动到最后奥运会的结束,我们有一个专门的5+护航小组,把相关的PE、SA、网络、过程改进等都聚合在一起,成为一个虚拟小组,保证你的某一个项目在护航周期里面健康健壮的运行。应急值班长,我们有一个旺旺群,这个群里面会有值班长角色,这个值班长在有重大故障发生的时候,他就是决策人,如果出现了有ABC多种方案的时候,对这个方案拍板的是这个值班人,这个人也是推进故障解决的推进人。消防群,我们要像消防队救火一样。摩天轮,三四百人的同学在一起,我们每年有一点比例的人员到各个团队进行轮岗,在轮岗的过程中其实也是给很多的团队带来新鲜的血液,另外也是跟这些轮岗的同学提供新的知识和新的视角。流程的保障,我们把这个流程从左到右,这是一个生命周期,这个里面有三个,一个是业务研发,发布变更、生产运维。最我们我们会定几个关键指标,属于我们自己的KPI指标,盯住了这几个K
您可能关注的文档
- 【CAD】计算机 助设计的120个实用技巧.doc
- 【mapgis应用根据工程创建图例.doc
- 【NI技术】选择数化仪示波器需要考虑的10个问题.docx
- 【一轮精品】高考历(岳麓版)总复习单元检测:第7单元+复杂多样的当代世界.doc
- 【三月月考】浙江省州市3月月考试卷-英语.doc
- 【上海中公金融人】发银行上海分行招聘公告.docx
- 【中农大】社会调查究方法_在线作业_C最终成绩:100.0.doc
- 【中口 高口资料】立自己的笔录符号系统.doc
- 【中考·高分】中考广东梅州)地理九年级复习配套检测题 世界地理 专题九 地球运动与海陆分布.doc
- 【中考·高分】中考广东梅州)地理九年级复习配套检测题 世界地理 专题十 世界气候.doc
文档评论(0)