2025年深度学习理论考试重点解析.docxVIP

2025年深度学习理论考试重点解析.docx

2025年深度学习理论考试重点解析

考试时间：______分钟总分：______分姓名：______

一、

简述深度学习相对于传统机器学习在处理复杂模式识别任务上的优势，并解释其核心驱动力。

二、

详细说明梯度下降（GradientDescent）算法的基本原理。假设我们正在使用均方误差（MSE）作为损失函数来训练一个简单的线性回归模型（y=wx+b），请写出计算其梯度（?MSE/?w和?MSE/?b）的表达式，并解释这些梯度为何指向损失函数减小的方向。

三、

什么是激活函数？在神经网络中引入激活函数的主要目的是什么？比较并简要说明Sigmoid、ReLU及其变体（如LeakyReLU）中至少两种激活函数的特点和潜在缺点。

四、

卷积神经网络（CNN）为何特别适合处理图像数据？请解释卷积层、池化层各自在CNN结构中的作用，并说明权值共享机制如何提升模型效率。

五、

简述循环神经网络（RNN）的基本原理，并解释其能够处理序列数据的原因。重点解析LSTM（长短期记忆网络）中细胞状态（CellState）和至少一种门控单元（如遗忘门）的作用机制，说明其如何缓解标准RNN的梯度消失/爆炸问题。

六、

比较并说明Dropout和BatchNormalization两种常用的正则化/优化技术。Dropout是如何工作的，它主要解决什么问题？BatchNor

更多 >