《卷积神经网络的结构及特点分析》4400字.docxVIP

《卷积神经网络的结构及特点分析》4400字.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

卷积神经网络的结构及特点分析综述

常规的神经网络通常包括三个基本层次:输入层、隐藏层和输出层,即图1中红色、蓝色、绿色部分表示,其中隐藏层层数不定。神经网络同人脑神经一样由许多神经元构成,从单个神经元的关系上看,常规全连接神经网络的每一神经元与它隔壁层上的一切神经元都有联系,即该网络是全连接的。这样的结构明显会对运算带来几何倍增的参数量,同时会使模型出现过拟合的情况,即模型在训练集上损失函数数值小准确率高但应用在测试集上时会出现损失函数数值变大准确率降低的现象。

卷积神经网络已经是现在最广为应用推崇的深度学习算法之一。它就是为有效解决上述问题而研究出现的,且随着深度学习的发展,对卷积神经网络的研究也愈发深入,2012到2017短短五年间,大型视觉识别挑战赛上各种卷积神经网络模型百花齐放,但结构大都万变不离其宗。图1卷积神经网络的蓝色隐藏层部分,可细化分为卷积层、池化层和全连接层。

图1常规全连接神经网络(左)与卷积神经网络结构(右)示意图

1.1卷积层

进行图像分类的第一步也是其核心就是要对输入图像进行识别并提取图中的“特殊部分”来进行后续的识别分类,卷积神经网络卷积层上的卷积操作就是用作对输入图像的特征进行提取的。

卷积的过程就是卷积核的感受野在图像上以规定步长不断移动扫描信息并进行卷积运算得到一个新图像的过程。这个过程中卷积核可以看作是一个小的用于特征提取的矩阵。感受野就是输入图像被有效提取特征信息的部分,即对卷积核的某一接受区域。待操作的输入图像可以看作一个大的矩阵。步长是卷积核对应的感受野在图像上沿横或纵向移动一次所经过的像素单位个数,步长和卷积核参数共同决定着输出图像的宽高规格。小矩阵在大矩阵中移动并进行线性运算,得到的数据又构成了一个新的矩阵,输出的新矩阵的每一像素单位即为这个卷积核在每个感受野上提取到的特征信息。经过卷积运算后的图像数据会变大,这就称之为激活,输出的新图像就称为特征图像。

(1)步长

关于步长和卷积核规格对输出结果的影响,可以由以下公式得出:

y=x?

其中,y为输出特征图像规格,x为输入图像规格,k为使用卷积核规格,stride为步长大小。

以下图2为例,对一块大小为5像素×5像素的感受野,使用步长为1的3×3的卷积核,卷积操作后得到的输出图像边长为y=5?31+1=3,即可得到3×3大小的特征图像。同理可得,当改变步长为2时,就可得到y=

图2不同步长下的卷积运算

(2)Padding填充

由卷积计算的公式及特性可知,当输入图像进行一次卷积计算后得到的输出图像宽高会根据步长和卷积核大小的不同而出现或多或少的缩小,这也可以看成是原始图像边缘的信息被遗漏了。但是为了易于计算且基于不遗漏特征信息的思想,人们希望得到的特征图尺寸与输入图像是一致的,所以考虑通过增改“0”信息以改变输入图像的大小,即为对输入图像进行Padding(填充)操作。

卷积核在输入图像上以不同的步长移动时,存在两种取样方式,如图3所示。一种是不允许卷积核外边框越过输入图像最外边框移动的方式,这样它所提取得到的特征信息图的规格就会略小于被提取图像,多步操作后原始图像非中心位置的信息就会有被遗漏的情况,也许这些部分就会包含此图的重点信息。第二种是允许卷积核探出输入图像的最外边进行取样的方式,这样得到的特征图层的尺寸就等于输入图像,且完全包含到了更多更详细的特征信息。这两种方式都需对输入图像进行padding操作,前者称为validpadding,也可以理解成对输入图像不进行多余的操作;后者称为samepadding,需要对原始图像进行外圈增加无信息像素单位的填充操作。

图3使用validpadding(左)与samepadding(右)的卷积取样示意图

基于填充操作的引入,对前文公式进行修改可以得到以下公式:

W2=

H2=

D2=K

其中,W2×H

一般为使输出图像和输入图像大小相同,当步长为1时,samepadding填充的值有关系P=F?12

(3)通道

对于上文输入输出图像的W×H×D表示,卷积神经网络将输入图像的神经元以三维数据的形式表示为width×height×depth,因为在现实应用中输入图像都是有色彩的,也就是有RGB三个通道的,如图4所示,他们的尺寸往往表示为高×宽×深,其中深度的数值也称通道数。

对于单通道的情况,卷积核可看作一个二维矩阵,基于前文所述计算方式进行卷积运算从而提取输入图像特征。

对于多通道的情况,每个通道上的卷积核的集合称filter(滤波器),输出等于输入图像的每一个通道上的信息分别与滤波器对应的该通道上的卷积核进行卷积运算得到的结果之和再加偏移量。对于卷积操作后通道数的变化有:当前层l的接受图的通道数等于l-1层的输出特征图的通道数,当前层l的输出特征图像

您可能关注的文档

文档评论(0)

02127123006 + 关注
实名认证
文档贡献者

关注原创力文档

1亿VIP精品文档

相关文档