- 2
- 0
- 约6.61千字
- 约 13页
- 2026-03-14 发布于湖北
- 举报
YOLO系列目标检测算法实现过程概述
目录
TOC\o1-3\h\u29991YOLO系列目标检测算法实现过程概述 1
102101.1引言 1
21561.2YOLO算法概述 1
190871.2.1YOLOv1目标检测算法 1
120531.2.2YOLOv2目标检测算法 3
159041.2.3YOLOv3目标检测算法 4
253011.2.4YOLOv4目标检测算法 5
102801.3YOLOv5目标检测算法 6
7841.3.1算法原理 6
251241.3.2算法流程 10
引言
YOLO是One-stage目标检测算法,从图片输入到网络输出只需要对网络进行一次推理,是端到端的目标检测与识别的算法,能够一次性预测多个边界框位置与类别的深度学习训练模型。采用候选区域训练方式的Fast-R-CNN时常把背景部分错误检测为某一特定目标,而YOLO没有选用提取候选框与滑动窗口的方式进行网络训练,而是直接选用输入的整张图片训练模型,这样可以实现更好的区分目标和背景区域的检测效果。因此,YOLO模型训练速度显著提升,计算成本大大降低,因此性能有所提高。
YOLO算法概述
YOLOv1目标检测算法
YOLOv1主干网络模型包含了24个卷积层与2个全连接层,其核心思想为通过卷积层提取输入图片特征,利用全连接层预测置信框坐标和类别种类REF_Ref24876\r\h[21]。算法的实现流程如下:
1、在YOLOv1网络中,设置了2个全连接层,因为网络中设置好的全连接层所连接的参数量为固定的,因此全连接层则要求输入图像是固定尺寸,所以把网络输入也将图像尺寸缩放成固定尺寸。
2、调整尺寸后将图片分割为S×S的网格,每个网格分别预测出B个boundingbox,每个boundingbox信息包含预测框中心点相对划分网格左上角的坐标(x,y)、预测框的宽高信息(w,h)、Confidence值以及类别信息。被检测物体的中心如果落在这个网格中就由此网格负责预测这个物体,输出的7×7张量代表着图片被划分成7×7的网格。其中Confidence的计算公式为:
(2.1)
3、将图像输入网络中,该网络的输出层表示为一个(7×7)×30维度的向量。其中30维向量所表达的信息为每个网格预测的2个boundingbox包含的10个数据,以及该网格
对20个类别的条件预测概率,如图2.1所示。
图2.1输出张量
4、每个网格预测的置信度和其对应20个类别的条件预测概率相乘,就得到每个预测框的对应类别概率。即在框内有物体的条件下,计算框中每种类别的概率。各类别概率的计算公式为:
(2.2)
(2.3)
其中,class-specificconfidencescores表示各个类别的概率,表示预测框包含物体的条件概率,公式既表示出了分类精度,又表示出了定位精度。
5、在每个框都有对象类别概率后,会产生98预测框,个对每个框进行阈值筛选,去除掉低置信度框,即小概率包含物体的预测框。再通过非极大值抑制进行处理,使得一个物体由一个预测框预测,去除多余预测框,得到最终检测结果。
由上所述,YOLOv1的训练与预测都采用端对端的策略,通过一个卷积神经网络实现对输入图片的检测,并且YOLOv1是对整张图片做卷积,所以不会将图片背景检误判。另外,YOLOv1的泛化能力强,在进行迁移训练时,模型鲁棒性高。但YOLOv1各网格只生成两个预测框,并且两个预测框的类别相同,所以对于小物体YOLOv1的检测效果不好。另外,YOLOv1检测物体的宽高比的泛化率较低,不寻常比例的物体的定位能力低,同时识别物体位置精准性差。
YOLOv2目标检测算法
YOLOv2相较于YOLOv1在mAP、定位准确度和召回率等方面有了较大提升,其改进策略遵循为保持模型检测速度,这同时也是YOLO模型的一大特点REF_Ref24961\r\h[22]。YOLOv2改进方法包括以下几个方面:
batchnormalization(批归一化)
batchnormalization使神经网络各层的输入分布不断变化,规范上层的输出,平衡输入数据的分布,提高训练速度。通过归一化输入,可以降低激活函数在特定输入区间内达到饱和状态的概率,使反向传播过程中的梯度消失和梯度爆炸问题,降低对某些超参数的敏感性。输入归一化对应于样本正则化,以获得更好的收敛速度和收敛效果。
采用Finetune高精度分类器
YOLOv2对分类网络进行了finetune,分辨
您可能关注的文档
- 2026《基于深度神经网络的局部放电诊断方法综述》3300字.doc
- 2026《BIM技术在建设工程各个阶段进度管理中的应用分析》3100字.docx
- 2026《锂电池充电管理芯片的PCB板版图设计案例》1700字.docx
- 2026《S县某水库土石坝设计》16000字.docx
- 2026《金矿地下采空区稳定性分析及治理方案研究》14000字.docx
- 2026《某型风电传动系统的变桨距传动设计》12000字.docx
- 2026《虚拟现实技术在高中物理教学中的应用问卷调查研究(附问卷)》8400字.docx
- 2026《深度学习算法在推荐系统中的应用分析》8600字.docx
- 2026《一款汽车的前悬架结构设计》9500字.doc
- 2026《运输车驱动主减速器结构设计计算》8100字.docx
原创力文档

文档评论(0)