2025年模型服务监控告警技术测试题(含答案与解析).docx

2025年模型服务监控告警技术测试题(含答案与解析).docx

2025年模型服务监控告警技术测试题(含答案与解析)

一、单项选择题(每题2分,共20分)

1.针对2025年大规模模型服务集群,以下哪项不属于模型推理层核心监控指标?

A.单实例GPU显存占用率

B.服务端到客户端网络延迟

C.模型输出结果分布稳定性

D.批处理任务队列积压时长

答案:B

解析:模型推理层监控聚焦模型计算资源使用(如A)、推理过程稳定性(如D)及输出质量(如C)。服务端到客户端网络延迟属于链路层监控指标,由API网关或负载均衡设备负责,非模型推理层核心。

2.某电商推荐模型在大促期间出现“点击率预测值异常偏高”告警,最可能的根因是?

A.

文档评论(0)

1亿VIP精品文档

相关文档