- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
优选
智能图像识别初探系列(三)
一、神经网络的结构
在上一篇文章中,我们介绍了智能图像识别的前置知识,现在我们就具体来了解下
图像处理过程。
我们提到卷积神经网络技术是一种深度前馈神经网络,在图片分类、图片检索、目
标检测、目标分割、目标跟踪、视频分类、姿态估计等图像视频相关领域中已有很
多较为成功的应用。
与普通的神经网络相比,我们知道卷积神经网络有一些特殊的层,也有一些卷积神
经网络中特有的专业名词,比如激活函数、全连接层、卷积层、池化层,下面我们
就来一一介绍一下。
1/9
优选
二、激活函数
激活函数的主要作用就是用来加入非线性因素的,以解决线性模型表达能力不足的
缺陷,在整个神经网络里起到至关重要的作用。因为在现实中,往往存在非常复杂
的线性不可分的情况,比如图中是一个二分类问题,我们要将两类点进行正确的分
类会发现这是一个线性不可分的问题,也就是说,在这个平面中,找不到一条直线
可以将图中的点完全分开。
2/9
优选
而激活函数的作用就是,在所有的隐藏层之间添加一个激活函数,比如sigmoid函
数等常见的激活函数,这样输出的就是一个非线性函数了,有了这样的非线性激活
函数后,神经网络的表达能力就会更加强大了。
3/9
优选
三、全连接层
全连接层可以简单地理解为神经网络的一个隐藏层,它包含权重向量W和激活函
数。要通过全连接层,首先要将一X图片的数值矩阵进行拉伸,并作为输入乘上
权重向量w,再将点乘后的结果作为激活函数的输入,最后激活函数的输出结果
便是全连接层的最终结果了。
4/9
优选
四、卷积层
卷积层与全连接层不同,它保留了输入图像的空间特征,即对图像的矩阵结构不做
任何改变。
在卷积层中,有一个概念叫做卷积核(kernel),常简称为卷积,有时也称为滤波
器filter。卷积的大小可以在实际需要时自定义其长和宽。在上一章节中,我们通
过卷积核对图像处理的介绍,知道了卷积的过程,简单来说:让卷积核在输入图片
上依次进行滑动,滑动方向从左到右,从上到下;每滑动一次,卷积核就与其滑窗
位置对应的输入图片做一次点积计算并得到一个数值。介绍完了卷积层,接下来我
们看看什么是卷积神经网络。
5/9
优选
五、卷积核
卷积神经网络是由一系列卷积层经过激活来得到的。接下来我们看一种更为通用的
卷积形式,在4x4的输入图片周边做1个像素的填充(pad=1),如图所示,步长
为1,kernel为2x2的卷积输出的特征层降维。
至此,卷积层的基本运算已介绍完毕,那么卷积神经网络和传统神经网络最大的不
同就是kernel,并且卷积层的计算是含有空间信息的。
六、池化层
在卷积神经网络还有一个重要概念就是池化层,池化是对图片进行压缩(降采样)
的一种方法,池化的方法有很多,如maxpooling、averagepooling等。例如,一
个4x4的特征层经过池化滤波器filter=2x2,步长stride=2的最大池化操作后可以
得到一个2x2的特征层。
6/9
优选
池化层对原始特征层的信息进行压缩,是卷积神经网络中很重要的一步。我们在后
面会看到绝大多数情况下,卷积层、池化层、激活层三者几乎像一个整体一样常常
共同出现。
这些应用处理的模块就像积木“”一样,可以帮助我们构建出卷积神经网络。然而
积木“”的排列方法有很多种,如何
原创力文档


文档评论(0)