- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【深度学习】添加检测类别?这是一份目标检测的一般指南
2018-05-28 原文
目标检测技术作为计算机视觉的重要方向,被广泛使用于自动驾驶汽车、智能摄像头、人脸识别及大量有价值的使用上。这些系统除了可以对图像中的每个目标进行识别、分类以外,它们还可以通过在该目标四周绘制适当大小的边界框来对其进行定位。本文作者从图像识别与目标检测的区分开头,进一步简约引见了目标检测的基本模块与实现方法。本文是目标检测的一般指南,它并没有具体引见主流的目标检测算法,这些算法读者可参考从 RCNN 到 SSD,这该当是最全的一份目标检测算法盘点。
本文受 PyImageSearch 的读者 Ezekiel 的启发,他上个星期在邮件中询问道:
Adrian 你好,
我认真地扫瞄了您之前关于深度学习目标检测 的文章及其跟进的实时深度学习目标检测 。感激你做的这一切,我在本人的样例项目中使用了你的源代码,但是我有两个问题:
1. 我该如何过滤/忽视那些我不感爱好的类?
2. 我如何才能向本人的目标检测器中添加新类别?有这个可能吗?
假如你能就这两个问题写一篇文章,我将不胜感激。
Ezekiel 并不是受此问题困扰的独一读者。现实上,假如你认真扫瞄了我最近关于深度目标检测两篇文章的评论,你会发觉最常见的问题可以被表述为:
我该如何修改你的源代码来包含我本人的类别?
由于这是一个如此常见的问题,并且是关于神经网络/深度学习目标检测器实际工作的一个误会,所以我打算在今日的博客中重温深度学习目标检测的话题。
具体地,你将在这篇文章中学到以下内容:
图像分类和目标检测的区分
深度学习目标检测器的组成:包含不同目标检测架构的区分和基本模型之间的区分
如何使用预训练模型进行深度学习目标检测
如何从一个深度学习模型中过滤或者忽视一些猜想类别
向深度神经网络添加类别或从中删除类别时常见的误区和误会
为了更多地了解深度学习目标检测,并解释清楚我们对基于深度学习的目标检测的一些误区和误会,请连续阅读本文。
想要查看本文相关的源码?请查看原文的下载链接(/2018/05/14/a-gentle-guide-to-deep-learning-object-detection/#):
深度学习目标检测的一般指南
今日的博客是对基于深度学习的目标检测的简约引见。我尽可能对深度学习目标检测器的组成做一个概述,包括使用预训练的目标检测器执行任务的源代码。
你可以使用这份指南来挂念学习深度学习目标检测,但是也要生疏到,目标检测是高度细节化的工作,我不行能在一篇文章中包含关于深度学习目标检测的全部细节。
这篇文章将从争辩图像分类和目标检测之间的本质区分开头,其中包括推断一个图像分类网络能否可以用于目标检测,以及在什么情况下可以这样使用等话题。
当我们理解了什么是目标检测时,随后会概述一个深度学习目标检测器的核心模块。它一般包括目标检测架构和基本模型,不生疏目标检测的读者可能会误会这两个部分。
在这里,我们将使用 OpenCV 来实现实时深度学习目标检测。我也会呈现如何在不修改网络架构或者重新训练的情况下忽视或者过滤一些不感爱好的目标类别。最终,我们通过争辩如何从深度学习目标检测器中添加或者删除类别来总结本文。
图像分类和目标检测的区分
图 1: 图像分类(左)和目标检测(右)的区分是比较直观和简约的。在图像分类中,整幅图像被分类为单一的标签。而在目标检测中,我们的神经网络还要找出图像中目标的位置(有可能是多个)。
在进行标准的图像分类时,我们将一张给定的图像输入到神经网络,然后得到一个最可能的标签,而且或许会同时得到相关的概率。
这个类别标签用来表征整个图像的内容,或者至少是图像最次要的可见内容。例如,上面的图 1 中,给定输入图像(左),我们的 CNN 给它的标签是「比格犬」。所以我们可以认为图像分类具有以下特点:
一张图像输入
一个类别标签输出
无论是通过深度学习还是其他计算机视觉技术的目标检测,都是基于图像分类构建的,只不过需要精确定位每个对象在图像中毁灭的位置。在进行目标检测的时候,给定一张输入图像,我们期望得到:
一个边界框列表,或者一幅图像中每个对象的(x,y)坐标
与每个边界框关联的类别标签
与每个边界框和类别标签关联的概率或者信任度得分
图 1(右)呈现了一个深度学习目标检测的例子。请留意,人物和狗都被用边界框找出了位置,同时类标签也被猜想到了。
所以,目标检测允许我们:
向网络输入一张图像
得到多个边界框以及类别标签
深度学习图像分类可以被用于目标检测吗?
图 2:非端到端深度学习的目标检测器使用一个滑动窗口(左)+图像金字塔(右)相结合的方法来分类。
所以现在你理解了图像分类和目标检测的根本区分:
在进行图像分类时,我们输入一张图像,得到一个输出类别
然而在进
您可能关注的文档
- 8027 CPS从CPS信息物理“系统”到CPC信息物理“计算”,解读物联网背后的背后的技术.docx
- 8027 财富空间当你老了,一生最后悔什么?.docx
- 8028 财富空间王阳明:5种生活智慧,解决人生难题.docx
- 8028 工业.0一个始于90年代的工业.0成功实践.docx
- 8028 智能驾驶六大核心!突破自动驾驶和智慧交通的必由之路.docx
- 8029 MES精细化工企业制造执行系统MES方案介绍.docx
- 8029 混合智能人机混合智能的哲学思考.docx
- 8029 区块链正方:制造业+区块链黄金时间即将到来,反方:末日博士怒指区块链七宗罪.docx
- 8525 财富空间傅盛、何小鹏、李想聊学习与焦虑:跟高段位选手聊0分钟,比你自己学几天还要多.docx
- 8525 工业.05G与工业.0到底有什么关系.docx
原创力文档


文档评论(0)