深度学习与神经网络技术手册（执行版）.docxVIP

下载本文档

1
0
约2.95万字
约 42页
2026-06-21 发布于江西
举报

深度学习与神经网络技术手册（执行版）.docx

深度学习与神经网络技术手册（执行版）

第1章深度学习基础架构与核心原理

1.1卷积神经网络（CNN）结构与特征提取机制

卷积神经网络（CNN）是深度学习中最具代表性的架构，其核心在于利用局部连接和权重共享机制来提取图像的空间特征。在卷积层中，输入图像被划分为多个小区域（称为卷积核或滤波器），每个滤波器都会滑动覆盖不同的输入区域，通过计算输入与滤波器的点积来一个特征图。这种滑动窗口机制使得同一滤波器可以在整个图像中重复使用，极大地减少了参数数量并提升了计算效率。特征提取过程通常从底层感受野开始，感受野的大小决定了神经元能捕捉到的图像局部范围。例如，在3x3的卷积核中，感受野大小为3x3，只能识别图像中心附近3x3像素的微小变化；而5x5的卷积核则能识别5x5区域内的变化。随着层数加深，感受野呈指数级扩大，能够逐步构建出从边缘、纹理到复杂形状的全局特征表示。

激活函数是CNN中引入非线性能力的关键，常见的选择包括ReLU（RectifiedLinearUnit）及其变体。ReLU函数定义为$f(x)=\max(0,x)$，它能有效地抑制负值并保留正值，加速梯度传播。在实际工程中，为了缓解ReLU的“死区”问题，常采用LeakyReLU或Swish等变体函数，它们允许负值产生微小的斜率，使网络训练更稳健。池化层用于降低特

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

深度学习与神经网络技术手册（执行版）.docxVIP