人工智能工程师《2026年》综合测试.docxVIP

  • 0
  • 0
  • 约6.8千字
  • 约 13页
  • 2026-03-28 发布于四川
  • 举报

人工智能工程师《2026年》综合测试

一、单项选择题(每题2分,共20分)

1.在PyTorch2.4中,若需对动态shape的4D张量(N,C,H,W)做通道级GroupNorm,且groups=32,下列哪段代码在AMP(自动混合精度)下既满足数值稳定性又避免显存冗余?

A.`torch.nn.GroupNorm(32,C,dtype=torch.float32)`

B.`torch.nn.GroupNorm(32,C).to(dtype=torch.float16)`

C.`torch.nn.GroupNorm(32,C,eps=1e-3,dtype=torch.float32)`后接`torch.cuda.amp.autocast()`

D.`torch.nn.GroupNorm(32,C,eps=1e-3)`并手动在`forward`内`.float()`转换

2.2026年主流MoE(Mixture-of-Experts)训练框架采用“ExpertParallelism+Zero3”组合,若模型共64位专家,每位专家参数量1.1B,当top-2门控激活时,理论上每张A100-80GBGPU(无CPUoffload)最多可完整放置几位专家而不触发OOM?(假设激活参数量+梯度+优化器状态均占显存,且Zero3已做完全分片)

A.4B.5

文档评论(0)

1亿VIP精品文档

相关文档