2025年人工智能期末试题及答案.docxVIP

  • 0
  • 0
  • 约5.61千字
  • 约 14页
  • 2026-02-09 发布于四川
  • 举报

2025年人工智能期末试题及答案

1.单项选择题(每题2分,共20分)

1.1在ResNet架构中,引入残差连接的主要目的是

A.减少网络参数量

B.缓解梯度消失并支持更深网络

C.提高卷积核感受野

D.降低显存占用

答案:B

1.2下列关于Transformer自注意力机制的说法正确的是

A.查询向量Q与键向量K的点积直接作为输出

B.注意力权重矩阵的维度与序列长度无关

C.缩放点积后需经过Softmax归一化

D.值向量V不参与梯度回传

答案:C

1.3在强化学习中,采用εgreedy策略时,若ε=0,则智能体行为表现为

A.完全随机探索

B.完全利用当前最优动作

C.以50%概率探索

D.以玻尔兹曼分布选择动作

答案:B

1.4联邦学习框架下,服务器端常用的安全聚合算法是

A.FedAvg

B.SecureBoost

C.Paillier同态加密

D.LocalSGD

答案:C

1.5若某二分类任务的正负样本比为1:99,且模型将所有样本预测为负类,则其F1值为

A.0.99

B.0.5

C.0.02

D.0

答案:D

1.6在PyTorch中,下列代码片段执行后x.grad的值为

```python

x=torch.tensor(2.0,requires_grad=True)

y=x3

y.backward()

```

A.4

B.6

C.8

D.12

答案:D

1.7关于生成对抗网络(GAN)的判别器损失函数,下列表述正确的是

A.使用sigmoid交叉熵,真实样本标签为0

B.使用均方误差,生成样本标签为1

C.使用sigmoid交叉熵,真实样本标签为1

D.使用KL散度,标签平滑设为0.9

答案:C

1.8在知识蒸馏中,温度参数T→∞时,软标签分布趋近于

A.均匀分布

B.狄拉克δ分布

C.正态分布

D.伯努利分布

答案:A

1.9下列哪种方法最适合解决图神经网络中的“过度平滑”问题

A.增加Dropout率

B.使用残差连接与JumpingKnowledge

C.提高学习率

D.移除激活函数

答案:B

1.10在VisionTransformer中,位置编码通常采用

A.可学习的一维向量

B.二维正弦余弦函数

C.图拉普拉斯特征向量

D.不需要位置编码

答案:A

2.多项选择题(每题3分,共15分;每题至少有两个正确答案,多选少选均不得分)

2.1以下属于无监督预训练策略的有

A.BERT的MaskedLanguageModeling

B.SimCLR的对比学习

C.GPT的自回归语言建模

D.Word2Vec的Skipgram

答案:B,D

2.2关于Adam优化器,下列说法正确的有

A.使用梯度的一阶动量

B.使用梯度的二阶动量

C.对学习率进行逐元素缩放

D.在凸条件下保证全局收敛

答案:A,B,C

2.3下列技术可有效缓解深度模型过拟合的有

A.LabelSmoothing

B.Mixup数据增强

C.增加网络宽度而不增加深度

D.EarlyStopping

答案:A,B,D

2.4在DiffusionModel的前向加噪过程中,若采用线性方差调度,则

A.时间步t越大,图像越接近高斯噪声

B.可直接解析计算任意步的样本分布

C.需要训练神经网络预测噪声

D.反向去噪过程需马尔可夫假设

答案:A,B,C,D

2.5以下关于模型压缩的说法正确的有

A.知识蒸馏属于模型压缩手段

B.剪枝后无需微调即可恢复精度

C.量化可将32位权重降至8位

D.低秩分解可压缩全连接层

答案:A,C,D

3.填空题(每空2分,共20分)

3.1在卷积神经网络中,若输入尺寸为224×224×3,采用64个7×7卷积核,步长为2,padding为3,则输出特征图的空间尺寸为________。

答案:112×112

3.2若某LSTM单元隐藏层维度为h,则其三个门控向量拼接后的总维度为________。

答案:3h

3.3在自注意力机制中,若序列长度为n,头数为h,每个头维度为d_k,则多头注意力输出矩阵的维度为________。

答案:n×hd_k

3.4若使用ReLU激活,则He初始化权重的方差为_____

文档评论(0)

1亿VIP精品文档

相关文档