计算机视觉应用--单阶段式2D目标检测网络 YOLOv5.pptx

下载文档

0
0
约7.4千字
约 42页
2025-03-01 发布于四川
举报
版权申诉
保障服务

计算机视觉应用--单阶段式2D目标检测网络 YOLOv5.pptx

1、本文档共42页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

单阶段式2D目标检测网络YOLOv56.3

6.3单阶段式2D目标检测网络YOLOv5YOLO(youonlylookonce)是一种端到端的目标检测模型,具有检测速度快、精度高等良好的性能。YOLO的基本思想:通过主干网络提取输入特征,得到指定大小的特征图输出,将输入图像划分成指定大小的网格单元,如果真实框中某个对象的中心坐标落在某个网格中,则由该网格来预测对象。每个对象分配3个边界框,通过逻辑回归来预测回归框。

YOLOv5包含YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x四种版本,YOLOv5s网络因其较小的模型尺寸而展现出最快的检测速度。相较于此,其他三种网络(YOLOv5m、YOLOv5l、YOLOv5x)则在YOLOv5s的基础上逐步加深了网络结构并增加了宽度,以进一步提升性能。这些模型的主要区别在于它们的特征提取网络,即主干网络的结构和复杂度。尽管网络大小有所不同,但在数据输入、颈部网络及数据输出方面,YOLOv5系列的所有模型都遵循通用的策略,这种设计确保了模型在不同规模和复杂度下都能保持一致的性能,本节内容主要讲解YOLOv5s。YOLOv5s是一种目标检测算法,其模型结构主要包括以下组成部分。6.3单阶段式2D目标检测网络YOLOv5

(1)数据输入:YOLOv5s的输入端主要由Mosaic图像增强、自适应锚框计算及自适应图片缩放组成。(2)特征提取网络(Backbone):YOLOv5使用CSPDarkNet53作为主干网络,其具有较强的特征提取能力和计算效率。6.3单阶段式2D目标检测网络YOLOv5

(3)颈部(Neck)网络:YOLOv5使用的是FPN+PAN结构,FPN+PAN结构使得网络能够在不同特征图层次上进行检测,提高目标检测的性能。(4)数据输出:YOLOv5s输出端的锚框机制是为了消除Grid敏感度,YOLOv5使用的是CIoU损失函数,该函数可以缓解目标检测中类别不平衡的问题,提高模型的性能。YOLOv5在输出结果后,会对重叠的目标框进行非极大值抑制处理,以得到最终的检测结果。6.3单阶段式2D目标检测网络YOLOv5

YOLOv5s整体的网络结构如图6-10所示。6.3单阶段式2D目标检测网络YOLOv5

6.3.1数据输入通常来说,神经网络对于图像输入的尺寸是有要求的,由于数据集图像的尺寸往往是不规则的,因此,可能会使得参数在神经网络传播的过程中无法更新,影响网络的训练。为此,YOLOv5s提出了一系列算法:Mosaic数据增强、自适应锚框计算、自适应图像缩放。6.3单阶段式2D目标检测网络YOLOv5小知识边缘检测是图像分割的重要步骤，常用的算法有Canny边缘检测、Sobel算子等。

Mosaic数据增强参考了2019年年底提出的CutMix数据增强方式,但CutMix只使用了2幅图像进行拼接,而Mosaic数据增强则使用了4幅图像,以随机缩放、随机裁剪、随机排布的方式进行拼接,如图6-11所示。1.Mosaic数据增强6.3单阶段式2D目标检测网络YOLOv5

使用Mosaic数据增强主要有以下两个优点。6.3单阶段式2D目标检测网络YOLOv5(1)丰富数据集:随机使用4幅图像,随机缩放,并随机分布拼接,丰富了目标检测的数据集,增加了很多小目标物体,增强网络模型对于小目标的鲁棒性(2)减少GPU的使用:Mosaic数据增强可以在单图像尺度的情况下直接计算4幅图像的数据,减小模型对批次大小的要求,使用1个GPU就可以达到良好的收敛效果。

在YOLOv3、YOLOv4中,当训练不同的数据集时,计算初始自适应锚框的值是通过单独的程序运行的。但YOLOv5将此功能嵌入代码中,每次训练时都会自适应地计算不同训练集中的最佳锚框。自适应锚框计算的流程如下。(1)载入数据集,得到数据集中所有数据的w、h。(2)将每幅图像中w、h的最大值等比例缩放到指定大小,较小边也相应缩放。(3)将边界框(boundingbox)由相对坐标改成绝对坐标(乘以缩放后的w、h)。(4)筛选边界框(boundingbox),保留w、h都大于或等于2的边界框(boundingbox)。(5)使用K均值聚类算法得到n个锚框。(6)使用遗传算法随机对锚框的w、h进行变异,如果变异后效果变好,就将变异后的结果赋给锚框;如果变异后效果变差,就跳过。2.自适应锚框计算6.3单阶段式2D目标检测网络YOLOv5

在常用的目标检测算法中,不同图像的w、h值不相同,因此常用的方式是先将原始图像统一缩放为一个标准尺寸,再送入检测网络中。前期YOLO算法中常用416×416、608×608等尺寸,如对800×600

您可能关注的文档

文档评论（0）

小刚 + 关注: 实名认证

内容提供者

教师资格证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2025年02月18日上传了教师资格证

1亿VIP精品文档

更多 >

计算机视觉应用--单阶段式2D目标检测网络 YOLOv5.pptx