2026年人工智能基础知识考试题及答案.docxVIP

  • 0
  • 0
  • 约5.05千字
  • 约 15页
  • 2026-03-17 发布于四川
  • 举报

2026年人工智能基础知识考试题及答案.docx

2026年人工智能基础知识考试题及答案

一、单项选择题(每题2分,共20分)

1.在深度学习训练过程中,若损失函数出现“NaN”值,最不可能的原因是

A.学习率过大导致梯度爆炸

B.使用了ReLU激活函数且初始化方差过小

C.损失函数中出现了log(0)

D.批归一化层参数被冻结

答案:B

解析:ReLU本身不会直接产生NaN,初始化方差过小会导致梯度消失而非NaN;log(0)或学习率过大才是常见NaN来源。

2.下列关于Transformer自注意力机制的说法,正确的是

A.查询向量Q与键向量K的点积结果直接作为注意力权重输出

B.缩放点积注意力中缩放因子为√d_k,目的是防止softmax输入方差过大

C.自注意力无法捕获长距离依赖,必须额外加入卷积层

D.多头注意力中每个头的维度必须等于原始嵌入维度

答案:B

解析:缩放因子√d_k用于缓解点积方差随维度增大而爆炸的问题;A漏掉softmax;C与事实相反;D每个头维度为d_model/h。

3.在联邦学习场景下,客户端上传的“模型更新”通常指

A.原始训练数据

B.梯度或权重差分

C.完整模型参数

D.损失函数值

答案:B

解析:为保护隐私,仅上传梯度或权重差分,避免泄露原始数据。

4.若某卷积层输入特征图尺寸为112×112,步长为2,填充为1,卷积核5×5,则输出特征图尺寸为

A.56×56

B.55×55

C.54×54

D.53×53

答案:A

解析:

o

5.在强化学习中,若策略π满足π(a|s)0对所有a∈A(s)成立,则该策略属于

A.确定性策略

B.贪婪策略

C.随机策略

D.最优策略

答案:C

解析:对所有动作赋予非零概率即为随机策略。

6.关于生成对抗网络(GAN)的判别器损失,下列表达式正确的是(E表示期望,D为判别器,G为生成器,x~p_data,z~p_z)

A.

?

B.

l

C.

?

D.

l

答案:A

解析:判别器目标为最大化正确分类真实与生成样本的概率,对应交叉熵损失。

7.在NLP任务中,使用子词算法BPE训练后,词表大小通常

A.与语料库总词数成正比

B.与合并操作次数无关

C.由初始字符词表与合并次数共同决定

D.固定为65536

答案:C

解析:BPE从字符级词表开始,通过指定合并次数动态扩展。

8.若某模型在ImageNet上Top-1准确率达85%,现将所有权重线性量化为8bit,理论上最大可能导致的准确率下降约为

A.0.1%

B.1%

C.10%

D.30%

答案:B

解析:8bit线性量化对CNN分类模型通常带来0.5%–2%的精度损失。

9.在自动驾驶感知系统中,将激光雷达点云投影到图像平面后,最需优先处理的坐标变换矩阵是

A.外参矩阵(Lidar→Camera)

B.内参矩阵(Camera本身)

C.畸变系数

D.鸟瞰视图变换矩阵

答案:A

解析:外参决定三维点如何映射到相机坐标系,是投影首要条件。

10.下列关于AI伦理准则的描述,不符合《欧盟AI伦理指南》2025修订版的是

A.可解释性仅适用于高风险系统

B.人类监督要求在任何情况下都可随时override

C.数据治理需确保训练数据无社会偏见

D.环境影响评估需覆盖模型全生命周期碳排

答案:B

解析:修订版强调“适当的人类监督”,并非“任何情况下”都可override,需与自动化级别匹配。

二、多项选择题(每题3分,共15分)

11.关于VisionTransformer(ViT)的图像块嵌入,下列说法正确的有

A.块尺寸固定为16×16像素

B.可通过卷积实现等价线性投影

C.需加入可学习的位置编码

D.块嵌入后序列长度与图像分辨率成正比

答案:B、C、D

解析:块尺寸可自定义;卷积核stride=patch_size即可等价线性投影;位置编码必不可少;序列长度=(H×W)/(P×P)。

12.以下技术可有效缓解模型训练中的过拟合

A.Dropout

B.权重衰减(L2正则)

C.提前停止

D.增加网络深度

答案:A、B、C

解析:增加深度若无正则反而加剧过拟合。

13.在分布式训练框架中,All-Reduce操作可用于

A.梯度聚合

B.参数服务器架构下的权重更新

C.数据并行同步

D.模型并行中的激活通信

答案:A、C

解析:All-Reduce主要用于数据并行梯度同步;参数服务器采用PS模式而非All-Reduce;模型并行通常需要点对点通信。

14.关于扩散模型(DiffusionModel)前向过程,下列正确的有

A.前向过程为固定马尔可夫链

B.每一步添加高斯噪声

C.逆过程需要学习

D.前向过程在采样阶段仍需迭代

答案:

文档评论(0)

1亿VIP精品文档

相关文档