2025年深度学习工程师考试题库(附答案和详细解析)(1013).docxVIP

  • 0
  • 0
  • 约7.43千字
  • 约 10页
  • 2025-10-19 发布于上海
  • 举报

2025年深度学习工程师考试题库(附答案和详细解析)(1013).docx

深度学习工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种激活函数最常用于解决深层神经网络的梯度消失问题?

A.Sigmoid

B.Tanh

C.ReLU

D.LeakyReLU

答案:C

解析:ReLU(修正线性单元)通过将负输入映射为0、正输入保持线性,避免了Sigmoid和Tanh在输入较大/较小时的梯度饱和问题(梯度趋近于0),是深层网络中缓解梯度消失的常用选择。LeakyReLU是ReLU的改进(负输入保留小梯度),但最常用的仍是ReLU。

在训练卷积神经网络(CNN)时,若输入图像尺寸为224×224×3(H×W×C),经过一个卷积核大小3×3、步长2、填充1的卷积层后,输出特征图的尺寸为?

A.112×112×3

B.224×224×64

C.112×112×64

D.224×224×3

答案:C

解析:卷积后尺寸计算公式为:(H-kernel_size+2padding)/stride+1。代入得(224-3+21)/2+1=223/2+1=111.5+1=112.5(向下取整为112),通道数由卷积核数量决定(假设为64),因此输出尺寸为112×112×64。

以下哪项不是循环神经网络(RNN)的主要缺陷?

A.长程依赖问题

B.梯度消失/爆炸

C.无法并行计算

D.参数量过大

答案:D

解析:RNN的参数量主要与隐藏层维度相关,相比CNN或Transformer,其参数量较小;主要缺陷是长程依赖(无法有效捕捉远距离信息)、梯度消失/爆炸(由于链式求导的连乘效应)、无法并行(依赖序列顺序)。

在训练过程中,若验证集损失持续下降但训练集损失不再下降,最可能的原因是?

A.过拟合

B.欠拟合

C.学习率过大

D.数据分布不一致

答案:B

解析:欠拟合表现为训练集和验证集损失均较高且不再下降;过拟合是训练集损失低但验证集损失上升;学习率过大可能导致损失震荡;数据分布不一致会导致验证集损失异常波动。

以下哪种优化器采用了动量(Momentum)机制?

A.SGD

B.Adam

C.RMSprop

D.Adagrad

答案:B

解析:Adam优化器结合了动量(Momentum,利用梯度历史的指数加权平均)和自适应学习率(RMSprop,利用梯度平方的指数加权平均);SGD无动量,RMSprop和Adagrad仅自适应学习率。

对于二分类任务,若正样本占比99%,最不适合的评估指标是?

A.准确率(Accuracy)

B.F1分数

C.召回率(Recall)

D.AUC-ROC

答案:A

解析:准确率在类别极不平衡时会失效(如全预测为负样本准确率仍99%);F1、召回率、AUC-ROC能更合理评估少数类表现。

Transformer模型中,自注意力(Self-Attention)的核心作用是?

A.捕捉序列中任意位置的依赖关系

B.降低模型参数量

C.加速前向传播

D.增强局部特征提取

答案:A

解析:自注意力通过计算序列中每个位置与所有位置的关联权重,打破了RNN的顺序依赖,可直接捕捉长距离依赖关系;参数量和计算速度与序列长度相关(非核心作用)。

以下哪种正则化方法通过随机失活神经元来防止过拟合?

A.L1正则化

B.L2正则化

C.Dropout

D.权重衰减(WeightDecay)

答案:C

解析:Dropout在训练时随机将部分神经元输出置0,强制模型学习冗余特征;L1/L2/权重衰减(与L2等价)通过添加参数范数惩罚项约束模型复杂度。

训练生成对抗网络(GAN)时,生成器(Generator)的目标是?

A.最小化真实数据与生成数据的分布差异

B.最大化判别器(Discriminator)的分类错误率

C.最小化交叉熵损失

D.最大化真实数据的概率

答案:A

解析:GAN的目标是通过生成器逼近真实数据分布,判别器区分真实与生成数据。生成器的优化目标是让判别器无法区分(即最小化分布差异),等价于最大化判别器对生成数据的误判率(B表述不准确)。

以下哪项不是BatchNormalization(BN)的作用?

A.加速训练收敛

B.允许使用更大的学习率

C.缓解内部协变量偏移(InternalCovariateShift)

D.完全消除过拟合

答案:D

解析:BN通过对每层输入归一化,减少输入分布的变化(缓解内部协变量偏移),允许更大学习率并加速收敛;但无法完全消除过拟合(需结合正则化)。

二、多项选择题(共10题,每题2分,共20分)

以下属于卷积神经网络(CNN)典型结构组件的有?

A.卷积层(ConvolutionalLayer)

B.循环层(RecurrentLayer)

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档