2025年运维产品经理面试试题及答案.docxVIP

  • 4
  • 0
  • 约6.89千字
  • 约 15页
  • 2025-12-16 发布于未知
  • 举报

2025年运维产品经理面试试题及答案

一、技术基础题

1.问题:在云原生运维场景中,Kubernetes集群出现Pod频繁重启但无明确错误日志的情况,作为运维产品经理,你会从哪些维度设计排查工具或功能?需要考虑哪些技术细节和用户场景?

答案:需从四个维度设计排查功能:

(1)事件与状态追踪:需抓取kubelet、kube-scheduler、kube-controller-manager的实时事件(通过client-go监听Event资源),重点标注Warning级事件(如FailedScheduling、FailedCreatePodSandBox)。用户场景:运维工程师需要快速定位是调度失败(资源不足/亲和规则冲突)还是运行时异常(容器健康检查失败)。技术细节:需支持按Pod名称、命名空间、事件类型过滤,关联Pod的创建时间、重启次数(status.restartCount)和最近重启时间戳(status.lastTerminationState)。

(2)资源限制与QoS分析:检查Pod的requests/limits配置及QoS等级(Guaranteed/Burstable/BestEffort)。用户场景:开发人员可能因误配CPU/Memory限制导致OOMKilled,但日志未捕获(内核直接终止进程)。技术细节:需展示Pod实际使用资源与限制的对比(通

文档评论(0)

1亿VIP精品文档

相关文档