容器云平台的运维架构设计概述.docx

? ? ? ? ? ? ? 容器云平台的运维架构设计概述 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 容器云平台运维架构和容器云平台的架构设计紧密相关。容器云平台的架构会直接影响着其运维架构的设计。我们在设计容器云平台的时候,就从DevOps的思想角度出发,就考虑到了开发、测试和运维之间的协作和配合,因此定义了以镜像仓库为媒介,明确分离开发、测试和应用运维职责。把镜像仓库作为标准化交付库,把应用服务整个生命周期过程就划分为三个阶段:开发、测试和应用服务运维(应用运维和资源运维分两层)。 应用服务的管理和运维是整个容器云平台的核心。运维运营能力是整个DevOps过程中最重要的一部分,是企业创造新价值的支撑。在数字化转型4T(指的是IT信息技术、CT通信技术、DT数据技术、OT运营技术)融合的时代,运维运营是关键。容器云平台的运维狭义的说是容器云平台自身的运维及对平台运营支持;广义的说也包括容器云平台之上业务应用服务的运维运营支持。我们在设计容器云平台时,定义了容器云平台“以应用管理为核心”,是从广义上来定义容器云平台的运维架构。作为传统企业用户,我们觉得不能只关注一个平台或者一个工具,更要关注其价值或潜在的价值在哪里,更更好的协助、配合相关部门团队取得价值,这样我们的运维工作才真的更有意义和更有价值。毕竟我们不是互联网企业,侧重点不一样,容器云平台、云管平台等都是基本的工具,都是为了更好的服务好业务团队,因此在设计容器云平台架构和定义容器云平台运维架构的时候,更多的是基于实际的需求来确定的。 容器云平台的运维与传统系统运维有一定的差异。在现代化应用开发的体系如DevOps 的驱动下,容器云平台的运维更需要一支全功能团队支撑。以社区为底座,让各研发团队掌握PaaS/容器云平台的技术。平台运维团队自身从开发者体验、上云流程、平台迭代到全栈的技术能力四大方面支撑建立安全稳定的平台以支持开发团队以较低使用门槛上容器。同时,这个平台的支撑团队应该是跨部门的覆盖运维与开发能力与技术栈。 对于PaaS/容器云平台团队而言,运维和平台迭代的技术能力关注点大致在以下几个大的方面: 1. 集群生命周期管理 Cluster lifecycle management 2. 集群与应用日志管理Log lifecycle management for cluster and apps 3. 监控与告警Monitoring / Alerting plan 4. 容器镜像生命周期管理Container image lifecycle management 5. 集群容量管理Cluster capacity management 6. 自动化运维实践Automated operational exercises 7. 应用模式Application patterns 8. 运营流程Team onboarding process 9. 平台与应用安全Platform and Application security 使用RACI (/item/RACI) 模型来考虑的话,平台的各项工作对于不同的角色有相对明确的定义,如下图所示: 因此,基于实际的需求考虑,在划分三个阶段的基础上,我们定义容器云平台运维架构包含应用服务运维和基础设施资源运维两个层次。传统丹田系统的运维运营,通常要自己管理和维护系统的基础设施资源。但如果采用了容器云平台,就不能从上到下还是自己来维护,否则那运维工作量可能远远超出想象。也正是基于此考虑,我们将基础设施资源运维和应用服务运维分离,使应用服务运维人员专注于应用运维,基础设施资源运维人员专注于基础设施资源运维。而又由于基础设施资源类型众多,有虚拟化、私有云、众多共有云等不同类型,需要由多云管理平台来统一管理和维护基础设施资源,并为容器云平台提供标准化的基础设施资源服务。容器云平台的平台管理员只负责容器云平台的基础设施资源的管理和分配,容器云平台只是使用资源而不运维资源。 同时,为了更好的利用容器的轻量、弹性、无状态等特性,同时又保证满足某些应用和服务的稳定性要求,我们结合容器化部署和非容器化部署各自优缺点,将应用服务管理和治理分为两层体系,容器云平台层和API网关层。 综合上面的思路和分析定义,容器云平台运维架构设计定义为三个阶段、两层运维和双层服务治理架构。使整个容器云平台运维架构清晰简明,也很便利的划分相关运维人员职责,更好的协调不同团队之间的工作,满足DevOps所期望的减少资源浪费、提升团队协作、提高IT效率、降低业务成本等需求。 1 以镜像仓库为媒介 容器云平台构建了以镜像仓库为媒介的三段过程,使开发、测试和生产分离,既兼顾传统开发运维模式,也满足实现开发运维一体化需求。 1.1 开发阶段 开

文档评论(0)

1亿VIP精品文档

相关文档