2025年高频k8s运维面试题及答案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年高频k8s运维面试题及答案

Q:Pod启动失败时,常见的排查步骤有哪些?需结合具体命令说明。

A:Pod启动失败时,首先通过`kubectldescribepodpod-name-nnamespace`查看Events字段,重点关注Warning级别的事件,常见原因包括镜像拉取失败(ImagePullBackOff)、初始化容器(InitContainer)失败、资源不足(如内存/CPU超过节点分配)或配置错误。若事件提示镜像问题,使用`kubectldescribepod`中的Image字段确认镜像名称和标签是否正确,检查`kubectlgetsecret-nnamespace`是否存在拉取私有镜像所需的ImagePullSecrets,或通过`dockerpullimage`(假设节点用Docker)测试镜像能否本地拉取。若初始化容器失败,通过`kubectllogspod-name-cinit-container-name-nnamespace`查看其日志,定位初始化逻辑错误。若事件显示OOMKilled(内存不足),需检查Pod的资源限制(resources.limits.memory)是否低于实际使用量,或节点可用内存是否不足(`kubectltopnodes`)。此外,需检查kubelet服务状态(`systemctlstatuskubelet`)和日志(`journalctl-ukubelet-n100`),确认是否因节点网络、磁盘空间(`df-h`)或容器运行时(如containerd)异常导致Pod无法创建。

Q:StatefulSet与Deployment的核心区别是什么?在什么场景下选择StatefulSet?

A:StatefulSet与Deployment均用于管理Pod副本,但StatefulSet强调有状态应用的稳定性和可识别性。核心区别包括:1)Pod名称有序且稳定(如web-0、web-1),而Deployment的Pod名称随机;2)StatefulSet的Pod基于HeadlessService分配稳定的DNS名称(pod-name.service-name.namespace.svc.cluster.local),支持稳定的网络标识;3)存储管理方面,StatefulSet通过VolumeClaimTemplates为每个Pod创建独立的PVC,扩容/缩容时按顺序操作(先创建web-0,再web-1,缩容时先删除web-1),确保存储与Pod的绑定关系;4)更新策略支持按序滚动更新(OrderedReady)或并行更新(Parallel),而Deployment默认并行滚动更新。适用场景包括需要稳定网络标识(如数据库主从通信)、持久化存储(如MySQL数据卷)或依赖顺序启动(如ZooKeeper集群选举)的有状态应用。

Q:如何实现K8s集群的高可用?需说明控制平面组件的部署方式及关键配置。

A:K8s高可用集群需确保控制平面(ControlPlane)组件(kube-apiserver、kube-controller-manager、kube-scheduler、etcd)无单点故障。部署方式通常为:1)etcd集群:至少3个节点组成的集群,使用TLS加密通信,数据目录单独挂载高性能磁盘,通过`etcdctlendpointhealth`检查成员健康状态;2)kube-apiserver:多实例部署,前端通过负载均衡器(如HAProxy、云厂商ALB)对外提供统一入口,配置`--advertise-address`为节点IP,`--etcd-servers`指向etcd集群所有成员,启用`--enable-admission-plugins`中的必要插件(如NamespaceLifecycle、ResourceQuota);3)kube-controller-manager和kube-scheduler:多实例部署,通过`--leader-elect`参数启用领导选举,确保只有一个实例处于活跃状态(Leader),其他为备用(Follower),避免脑裂。此外,需配置控制平面节点间的网络连通(如跨可用区部署),定期备份etcd数据(`etcdctlsnapshotsave`),并为APIServer配置健康检查(如`/healthz`端点),确保负载均衡器能及时剔除故障实例。

Q:Service的ClusterIP、NodePort、LoadBalancer类型有何区别?生产环境中如何选择?

A:三种Service类型的核心区别在于暴露范围和实现方式:1)ClusterIP:默认类型,仅在

您可能关注的文档

文档评论(0)

yclhdq + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档