- 1
- 0
- 约2.95万字
- 约 42页
- 2026-06-21 发布于江西
- 举报
深度学习与神经网络技术手册(执行版)
第1章深度学习基础架构与核心原理
1.1卷积神经网络(CNN)结构与特征提取机制
卷积神经网络(CNN)是深度学习中最具代表性的架构,其核心在于利用局部连接和权重共享机制来提取图像的空间特征。在卷积层中,输入图像被划分为多个小区域(称为卷积核或滤波器),每个滤波器都会滑动覆盖不同的输入区域,通过计算输入与滤波器的点积来一个特征图。这种滑动窗口机制使得同一滤波器可以在整个图像中重复使用,极大地减少了参数数量并提升了计算效率。特征提取过程通常从底层感受野开始,感受野的大小决定了神经元能捕捉到的图像局部范围。例如,在3x3的卷积核中,感受野大小为3x3,只能识别图像中心附近3x3像素的微小变化;而5x5的卷积核则能识别5x5区域内的变化。随着层数加深,感受野呈指数级扩大,能够逐步构建出从边缘、纹理到复杂形状的全局特征表示。
激活函数是CNN中引入非线性能力的关键,常见的选择包括ReLU(RectifiedLinearUnit)及其变体。ReLU函数定义为$f(x)=\max(0,x)$,它能有效地抑制负值并保留正值,加速梯度传播。在实际工程中,为了缓解ReLU的“死区”问题,常采用LeakyReLU或Swish等变体函数,它们允许负值产生微小的斜率,使网络训练更稳健。池化层用于降低特
原创力文档

文档评论(0)