- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
YOLO:Youonlylookonce.
YOLO算法基本原理
将一张图片等分为S*S个区域
每一个区域负责检测,目标对象的中心落在本区域内的物体
每个预测到的物体会产生多个可能的边界框
每个单元格会产生一个[有无对象Pc,x,y,w,h,class1,class2,classN]向量
初次看到这个算法的过程,会很疑惑,因为这个过程缺少了一些细节。
例如:如何检测物体的中心?如何产生可能的边界框?如何判断边预测的界框是否正确?让我们看后面的内容。
交并比(IoU)
交并比是一个评估边界预测好坏的评估算法。
交并比预测边框面积真实边界面积预测边框面积真实边界面积通常,当IoU=0.5,视为预测正确。
0.5的取值完全认为,可以设置其他的,根据具体精度要求来决定。
如果预测结果和真实结果完全重合,IoU=1.
训练方法
首先让我们来看这个网络结构,该结构是一个常规的卷积网络结构。从网络中可以得到,适用卷积核,按照卷积核大小的步长进行卷积,这样就实现了把一个图片分成多一个区域。大大减少了图片的卷积次数,但是也降低了精准度(相比滑动窗口检测方法)。
然后再来看Loss函数,
Loss函数由四部分组成:
对象存在误差
位置误差
边框大小误差
类别分类误差
的意思指,当没有对象时(noobject)为1,否则为0.
非最大值抑制
如何检测到物体的中心?
当很多方框中都有要检测的目标的时候,
这些方框会说,嘿!我的区域里面有你要的对象!
那么这个时候,到底哪个方框才是物体的中心呢?
也确实没办法知道,所以就让这些方框都进行检测这个物体。
那么就会得到一个物体,被多个方框所框住。
通过非最大值抑制算法可以实现,确保图片中的每一个物体,只被一个方框给框住,而不会出现同一个物体上出现多个方框。
具体的过程:
有无对象(Pc),在算法原理中提到
通过YOLO算法进行预测
将有无对象(Pc)0.6(或者其他值)的结果去除
对剩下的结果进行以下循环:
找到Pc最大的一个数据,这个就是最终要的结果
通过计算其他产生的边界框与Pc最大的数据的边界框进行IoU计算,去除IoU=0.5的其他边界框。
直到没有新的最终结果的产生
通过这个循环,我们最终就会得到,确保每一个物体只有一个边界框,且这个边界框是可能性最大的。
在实际操作中,对于多个类型的物体,例如汽车,人,自行车等
应该对这三种类型进行三次的独立非最大值抑制
因为如果一起进行非最大值抑制的话,当人遮挡汽车的时候,人和车的结果就会不准确。两者的IoU比较大。
锚点框(AnchorBoxes)
为什么会产生这个算法呢?
在以下条件下:
YOLO的区域数量比较小,每个区域比较大
人遮挡车
导致,人和车的中心点不巧刚好落到同一个区域内,
而每个区域只能输出一个[有无对象Pc,x,y,w,h,class1,class2,classN]向量,那么CNN就会随机输出人或者车。
那么如何解决这个问题呢?
人是竖着的,车是横着的,那么我们可以让每一个区域负责去识别两次(由锚点框的数量决定)。
产生这样的一个向量:
[有无对象Pc,x,y,w,h,class1,class2,classN,有无对象Pc,x,y,w,h,class1,class2,classN],即[2*n],你也可以把,这个拆成[2,n]。
将结果分成两个区域,第一个是竖着的锚点框,第二个是横着的锚点框。
存放的时候,计算w/h(宽高比),和锚点的宽高比进行比较,相近即属于该锚点框。如此就可以解决这个问题了。
但是其实这个并不能解决3个物体重叠的情况,也不能解决锚点框相似的情况的重叠,
不过值得庆幸的是,当YOLO的区域足够多的时候,发生重叠的概率比较小,如果不幸发生了,那就需要写一个选择算法,选择其中一个。
YOLO算法实现
借助YOLO算法,实现对水表的表盘目标检测。去Github下载
您可能关注的文档
- 光学系统集成.docx
- 机器视觉主要硬件参数详解.docx
- 机器人运动学中的非完整约束与运动模型推导.docx
- 计算摄影学基石:相机成像原理.docx
- 如何优化深度学习模型.docx
- 机器视觉在轮胎检测中的应用.docx
- 基于Transformer的多模态BEV融合方案.docx
- 这些图像传感器如何选?先get这五大要点√.docx
- “分类”“聚类”傻傻分不清楚.docx
- 从神经网络开始讲图像分类基础.docx
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
最近下载
- 高一下学期第一次月考数学试卷(基础篇)(解析版)_1.docx
- 海洋渔业捕捞生产安全操作规程培训课件.pptx
- 城市绿化生态修复项目背景概述包括对项目的详细描述包括规模、位置和设计特点.docx
- QHZTT001-2024 混合型饲料添加剂 糖萜素(I型、II型).pdf
- 激光-电子非线性康普顿散射特性分析-analysis of laser - electron nonlinear compton scattering characteristics.docx
- 无人机驾驶员高级巡检理论考试复习题库(全优).docx VIP
- ESAB(A2-A6)PEH过程控制器解说.doc
- 22G101三维彩色立体图集.doc VIP
- 管道支架计算表.xls VIP
- 燃料油检测报告.docx
文档评论(0)