人工智能创新实验教程 课件 第15章 VGG16网络 .pptx

人工智能创新实验教程 课件 第15章 VGG16网络 .pptx

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

宁夏大学第十五章VGG16网络

www.islide.cc2目录

CONTENT01introduction引言02Algorithmoverview算法概述03Experimentaldata实验数据04Algorithmcombat算法实战05chaptersummary本章小结

SectionHeaderHere01introduction引言

引言 VGG是Oxford的VisualGeometryGroup组提出的,名字也是由此而来。2012年AlexNet在ImageNet数据集上显著的降低了分类错误率,深度学习一下子变得炙手可热,很多模型在此基础上做了大量尝试和改进。大体有两个方向:1,小卷积核:2013年提出的ZFNet(把卷积核缩小进行模型可视化);2,多尺度:训练和测试使用整张图的不同尺度,在此基础上还考虑了网络深度对结果的影响。在2014年牛津大学机器人实验室尝试构建了更深的网络,文章中称为VERYDEEPCONVOLUTIONALNETWORKS。这个阶段,没有解决网络太深梯度反向传播消失的问题,且受限于GPU等硬件设备的性能,所以深度网络不易于训练。不过,VGG显然是当时最好的图像分类模型,在2014年的ILSVRC比赛上获得了分类项目的第二名,和定位项目的第一名,同时模型对其他的数据集有很好的泛化能力。证明了加深网络能在一定程度上影响网络的识别效果。VGG由于其结构简单,提取特征能力强,所以应用场景很广泛,经常用于目标检测的backbone来提取特征,也用于gan网络内容特征提取。

引言 本章内容主要基于2014年牛津大学发表的一篇文章”VERYDEEPCONVOLUTIONALNETWORKSFORLARGE-SCALEIMAGERECOGNITION“,该文章提出了VggNet模型。论文信息如下: article:《VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition》 arXiv:[1409.1556]VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition intro:ICLR2015 homepage:VisualGeometryGroupHomePage

SectionHeaderHere02模型概述

1VGG网络结构及原理1.结构 VGG中根据卷积核大小和卷积层数目的不同,可分为A,A-LRN,B,C,D,E共6个配置(ConvNetConfiguration),其中以D,E两种配置较为常用,分别称为VGG16和VGG19。 右图给出了VGG的六种结构配置:

1VGG网络结构及原理 我们针对VGG16进行具体分析发现,VGG16共包含: (1)13个卷积层(ConvolutionalLayer),分别用conv3-XXX表示 (2)3个全连接层(FullyconnectedLayer),分别用FC-XXXX表示 (3)5个池化层(Poollayer),分别用maxpool表示 其中,卷积层和全连接层具有权重系数,因此也被称为权重层,总数目为13+3=16,这即是VGG16中16的来源。(池化层不涉及权重,因此不属于权重层,不被计数)。

1VGG网络结构及原理 原理 其实VGG网络模型的设计思想很清晰,主要为了探究网络深度对模型精确度的影响,所以VGG的设计模仿了AlexNet,只是增加了卷基层conv的数量和减小卷积核尺寸,全连接层FC保留了AlexNet的结构,相比于AlexNet,VGG网络有如下优点: 1.卷积层的数量更多,提高模型的准确度2.采用了较小的卷积核,减少模型的参数,VGG结构中只采用了3x3和1x1的卷积核 在VGG中,使用3个3x3卷积核来代替7x7卷积核,使用了2个3x3卷积核来代替5*5卷积核,这样做的主要目的是在保证具有相同感知野的条件下,提升了网络的深度,在一定程度上提升了神经网络的效果。比如,3个步长为1的3x3卷积核的一层层叠加作用可看成一个大小为7的感受野(其实就表示3个3x3连续卷积相当于一个7x7卷积),其参数总量为3x(9xC^2),如果直接使用7x7卷积核,其参数总量为49xC^2,这里C指的是输入和输出的通道数。很明显,27xC2小于49xC2,即减少了参数;而且3x3卷积核有利于更好地保持图像性质。

1VGG网络结构及原理这里解释一下为什么使用2个3x3卷积核可以来代替5*5卷积核: 5x5卷积看做一个小的全连接网络在5x5区域滑动,我们可以先用一个3

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档