人工智能创新实验教程课件第15章 VGG16网络 .pptx

下载文档

0
0
约3.56千字
约 28页
2024-06-27 发布于山东
举报
版权申诉
保障服务

人工智能创新实验教程课件第15章 VGG16网络 .pptx

1、本文档共28页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

宁夏大学第十五章VGG16网络

www.islide.cc2目录

CONTENT01introduction引言02Algorithmoverview算法概述03Experimentaldata实验数据04Algorithmcombat算法实战05chaptersummary本章小结

SectionHeaderHere01introduction引言

引言 VGG是Oxford的VisualGeometryGroup组提出的，名字也是由此而来。2012年AlexNet在ImageNet数据集上显著的降低了分类错误率，深度学习一下子变得炙手可热，很多模型在此基础上做了大量尝试和改进。大体有两个方向：1，小卷积核：2013年提出的ZFNet（把卷积核缩小进行模型可视化）；2，多尺度：训练和测试使用整张图的不同尺度，在此基础上还考虑了网络深度对结果的影响。在2014年牛津大学机器人实验室尝试构建了更深的网络，文章中称为VERYDEEPCONVOLUTIONALNETWORKS。这个阶段，没有解决网络太深梯度反向传播消失的问题，且受限于GPU等硬件设备的性能，所以深度网络不易于训练。不过，VGG显然是当时最好的图像分类模型，在2014年的ILSVRC比赛上获得了分类项目的第二名，和定位项目的第一名，同时模型对其他的数据集有很好的泛化能力。证明了加深网络能在一定程度上影响网络的识别效果。VGG由于其结构简单，提取特征能力强，所以应用场景很广泛，经常用于目标检测的backbone来提取特征，也用于gan网络内容特征提取。

引言本章内容主要基于2014年牛津大学发表的一篇文章”VERYDEEPCONVOLUTIONALNETWORKSFORLARGE-SCALEIMAGERECOGNITION“，该文章提出了VggNet模型。论文信息如下： article：《VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition》 arXiv：[1409.1556]VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition intro：ICLR2015 homepage：VisualGeometryGroupHomePage

SectionHeaderHere02模型概述

1VGG网络结构及原理1.结构 VGG中根据卷积核大小和卷积层数目的不同，可分为A，A-LRN,B,C,D,E共6个配置(ConvNetConfiguration)，其中以D,E两种配置较为常用，分别称为VGG16和VGG19。右图给出了VGG的六种结构配置：

1VGG网络结构及原理我们针对VGG16进行具体分析发现，VGG16共包含：（1）13个卷积层（ConvolutionalLayer），分别用conv3-XXX表示（2）3个全连接层（FullyconnectedLayer）,分别用FC-XXXX表示（3）5个池化层（Poollayer）,分别用maxpool表示其中，卷积层和全连接层具有权重系数，因此也被称为权重层，总数目为13+3=16，这即是VGG16中16的来源。(池化层不涉及权重，因此不属于权重层，不被计数)。

1VGG网络结构及原理原理其实VGG网络模型的设计思想很清晰，主要为了探究网络深度对模型精确度的影响，所以VGG的设计模仿了AlexNet，只是增加了卷基层conv的数量和减小卷积核尺寸，全连接层FC保留了AlexNet的结构，相比于AlexNet，VGG网络有如下优点： 1.卷积层的数量更多，提高模型的准确度2.采用了较小的卷积核，减少模型的参数，VGG结构中只采用了3x3和1x1的卷积核在VGG中，使用3个3x3卷积核来代替7x7卷积核，使用了2个3x3卷积核来代替5*5卷积核，这样做的主要目的是在保证具有相同感知野的条件下，提升了网络的深度，在一定程度上提升了神经网络的效果。比如，3个步长为1的3x3卷积核的一层层叠加作用可看成一个大小为7的感受野（其实就表示3个3x3连续卷积相当于一个7x7卷积），其参数总量为3x(9xC^2)，如果直接使用7x7卷积核，其参数总量为49xC^2，这里C指的是输入和输出的通道数。很明显，27xC2小于49xC2，即减少了参数；而且3x3卷积核有利于更好地保持图像性质。

1VGG网络结构及原理这里解释一下为什么使用2个3x3卷积核可以来代替5*5卷积核： 5x5卷积看做一个小的全连接网络在5x5区域滑动，我们可以先用一个3

您可能关注的文档

文档评论（0）

lai + 关注: 实名认证

内容提供者

精品资料

咨询Ta 进入空间

用户编号：7040145050000060

1亿VIP精品文档

更多 >

人工智能创新实验教程课件第15章 VGG16网络 .pptx