- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
技术盛宴|数据中心自动化运维技术探索之交换机零配置上线
近几年来,互联网行业处于一个快速发展的快车道,一个又一个风口不断地涌向周边行业。共享单车的出现解决了人们出行最后一公里的问题;新零售概念的提出,无人货柜的出现,更是将线上和线下的数据打通,优化了人们的购物体验;以抖音为首的短视频应用,在一夜间爆红,成为当下社交与宣传的重要载体。
而数据中心作为支撑这些业务的基础设施,其规模也随着业务的激增逐渐扩大,单集群内超过数万台服务器的情况已不再罕见。面对如此庞大的服务器数量,在网络建设之初的交换机网络开局已成为网工的梦魇。
数据中心开局现状
聚焦于数据中心场景,我们先来回顾一下传统的交换机网络开局流程。
图1传统网络设备开局流程
提前准备交换机的版本文件;
根据部署的架构场景选择对应的配置模板;
开始“搬砖”,到达现场,设备拆箱集中堆放,加电启动;
使用U盘插到交换机,串口线连接设备,逐台进行版本升级(若需要);
根据配置模板结合实际设备的情况进行VLAN、IP、路由以及其他基本信息的修订,然后开始刷配置(另外按照各公司要求,还会协助收集设备的SN用于资产管理);
协调弱电同学帮忙搬到机房上架;
基于Checklist完成连通性的测试工作。
整套流程下来,既耗人力,又耗时间。据实际项目经验来看,在不堆叠的前提下完成一台设备的升级和配置大约在10分钟,堆叠情况下由于设备需要重启,需要30分钟才能完成。
总结来看,对于支撑数万台服务器集群的数据中心网络场景,如果按照这种传统的开局模式来部署,会存在以下几点不足:
效率低下:靠手工方式进行设备的版本升级、刷脚本,效率非常低;
出错率高:重复性的工作会导致网工疲于思考,稍有不慎出现失误,需要额外的时间用于排查错误更正,产生一定的时间损耗。
对此,各厂家做了许多的探索,比如零配置上线技术。
二、数据中心自动化开局
随着数据中心规模的不断增大,标准化的建设方式已经成为主流。每个集群内的服务器以及网络设备的规模都是固定的,对应到网络设备的配置策略也是一致的(当然IP等基础信息会略有不同)。因此,在这样标准化、规范化的场景下,我们可以将这些重复性的、机械性的工作编成处理逻辑,交给网络设备自己去完成上线工作,进而解放人力,同时也降低了人们出错的风险。
厂商对于自动化上线技术的开发,主要是利用编程语言(比如Python、Go等)进行逻辑处理,让网络设备自行加载,完成上线,例如ZAM(Zero-configureAutomaticManage,零配置自动管理)技术。
交换机自动化上线的思路:新出厂或空配置的设备上电启动后自动向文件服务器中获取文件并加载(包括版本文件、配置文件、补丁文件等),实现设备的免现场配置、
[sn].error)
图5ZAM文件夹目录
图6成功执行ZAM流程
失败处理
主逻辑任意一个节点发生故障,跳到故障处理时,执行下列动作
上传[sn].log到/ZAM_LOG/
上传[sn].error到/ZAM_STATUS/
写0到/etc/zam.txt(通告zam执行失败)
清空本地本次执行相关文件([sn].CFG,[sn].ZAM,[sn].params,[sn].ok,[sn].error)
三、探索创新
随着网络设备对于类似Python的高级编程语言环境的支持愈加成熟,零配置上线技术在IDC场景中得到了普遍的应用。一方面加快了设备的开局速度,降低了人为操作失误的风险,节省人力投入;另一方面,对于后期设备的运维工作(比如扩容、故障替换等),只需要上报或者替换SN就可以自动完成加载,也不需要人工的参与。
那么,除了IDC场景有这样的需求之外,对于其他场景,是否也存在类似的运维痛呢?
锐捷网络秉承着创新、探索与实践的思路,在新零售门店场景,也做了深入的市场调研与分析。
最近火爆的新零售门店,其特点就是数量众多,业务的激增导致开店速度尤其快。但是门店不会有专业的运维同学驻场,所以网络开局时需要网工四处出差;日常遇到故障,如果远程不能解决也需要网工到现场处理,人力投入极大。
对此,聚焦于新零售门店场景,我们基于数据中心零配置开局的思路进行创新,致力于打造全新的自动化门店网络解决方案,提升新零售门店网络开局和运维的效率,减少人力服务成本。
图7自动化门店网络解决方案组网设计
目前我们正在和新零售客户积极的探索和实践中,敬请期待。如果有相关建议和思路,也欢迎留言互动,共同探讨。
以上内容由锐捷网络提供
文档评论(0)