目标检测RCNN系列讲解.pptxVIP

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于R-CNN的系列目标检测算法组员:R-CNN,SPPNET,FastR-CNN,FasterR-CNN

目录CONTENTS01背景知识02RCNNSPPNETFastR-CNNFasterR-CNN030504实例展示06

01背景知识PARTONE

背景知识04目标检测是在给定的图片中精确找到物体所在位置,并标注出物体的类别。物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图片的任何地方,并且物体还可以是多个类别。目标检测

背景知识05图像识别(classification):输入:图片输出:物体的类别评估方法:准确率。定位(localization):输入:图片输出:方框在图片中的位置(x,y,w,h)评估方法:检测评价函数intersection-over-union

背景知识06目标检测算法1.传统的目标检测算法:Cascade+HOG/DPM+Haar/SVM以及上述方法的诸多改进、优化;2.候选区域/窗+深度学习分类:通过提取候选区域,并对相应区域进行以深度学习方法为主的分类的方案,如:R-CNN(SelectiveSearch+CNN+SVM)SPP-net(ROIPooling)FastR-CNN(SelectiveSearch+CNN+ROI)FasterR-CNN(RPN+CNN+ROI)R-FCN等系列方法;3.基于深度学习的回归方法:YOLO/SSD/DenseBox等方法;以及最近出现的结合RNN算法的RRCdetection;结合DPM的DeformableCNN等。

02R-CNNPARTTWO

R-CNN08传统目标检测方法传统目标检测的算法基本流程如下:使用不同尺度的滑动窗口选定图像的某一区域为候选区域;从对应的候选区域提取如HarrHOGLBPLTP等一类或者多类特征;使用Adaboost、SVM等分类算法对对应的候选区域进行分类,判断是否属于待检测的目标。1、基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;2、手工设计的特征对于多样性的变化没有很好的鲁棒性。传统目标检测方法的缺点

R-CNN09R-CNN是Region-basedConvolutionalNeuralNetworks的缩写,中文翻译是基于区域的卷积神经网络,是一种结合区域提名(RegionProposal)和卷积神经网络(CNN)的目标检测方法。区域提名(RegionProposal):利用图像中的纹理、边缘、颜色等信息,预先找出图中目标可能出现的位置。需要解决的问题:(1)适应不同尺度(2)多类别图像的适应性(3)速度。R-CNN的主要贡献:?

1)传统目标检测算法一般使用滑动窗口扫描所有可能区间,同时需要考虑变化窗口尺寸以适应不同大小的目标,这种方法效率太低。R-CNN使用SelectiveSearch方法预先提取所有候选区域?;

2)传统目标检测算法依赖人工设计的特征,R-CNN使用深度学习自动提取和学习特征。

R-CNN10R-CNN的简要步骤如下:(1)输入测试图像;(2)利用选择性搜索(SelectiveSearch)算法在图像中从下到上提取2000个左右的可能包含物体的候选区域;(3)因为取出的区域大小各自不同,所以需要将每个候选区域缩放(warp)成统一的227x227的大小并输入到CNN,将CNN的fc7层的输出作为特征;(4)将每个候选区域提取到的CNN特征输入到SVM进行分类。R-CNN的总体思路

R-CNN11SelectiveSearch算法?

R-CNN12RCNN的具体步骤步骤一:训练(或者下载)一个分类模型(比如AlexNet)

R-CNN13步骤二:对该模型做fine-tuning?将分类数从1000改为20,比如20个物体类别+1个背景?去掉最后一个全连接层

R-CNN14步骤三:特征提取?提取图像的所有候选框(选择性搜索SelectiveSearch);?对于每一个区域:修正区域大小以适合CNN的输入,做一次前向运算,将第五个池化层的输出(就是对候选框提取到的特征)存到硬盘。

R-CNN15步骤四:训练一个SVM分类器(二分类)来判断这个候选框里物体的类别每个类别对应一个SVM,判断是不是属于这个类别,是就是positive,反之nagative。比如下图,就是对狗分类的SVM

R-CNN16步骤五:使用回归器精细修正候选框位置:对于每一个类,训练一个线性回归模型去判定这个框是否框得完美

R-CNN171、基于R-CNN目标检测算法只能输入固定尺寸的图片,样本输入受限2、经人工处理过的图片,易降低网络识别检测精度3、

文档评论(0)

151****9459 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档