- 1、本文档共99页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
人脸识别
通用目标检测
概述01任务目标检测的意义02任务目标检测的常用方法03任务
学习目标了解目标检测的概念和意义了解常用的目标检测方法
1概述
1概述在计算机视觉众多的技术领域中,目标检测(ObjectDetection)也是一项非常基础的任务,图像分割、物体追踪、关键点检测等通常都要依赖于目标检测。在目标检测时,由于每张图像中物体的数量、大小及姿态各有不同,也就是非结构化的输出。在计算机视觉中,图像分类、目标检测和图像分割都属于基础、也是目前发展最为迅速的3个领域,下面具体看一下这几个任务之间的区别。图像分类:输入图像往往仅包含一个物体,目的是判断每张图像是什么物体,是图像级别的任务,相对简单,发展也最快。目标检测:输入图像中往往有很多物体,目的是判断出物体出现的位置与类别,是计算机视觉中非常核心的一个任务。图像分割:输入与物体检测类似,但是要判断出每一个像素属于哪一个类别,属于像素级的分类。图像分割与目标检测任务之间有很多联系,模型也可以相互借鉴。
1概述目标检测技术,通常是指在一张图像中检测出物体出现的位置及对应的类比,要求检测器输出5个value:物体类别class、boundingbox左上角x坐标x、boundingbox左上角y坐标y、boundingbox右下角x坐标x、boundingbox右下角y坐标y。如右图所示,目标检测能够大致的识别出图片的物体以及物体所在位置并标注出来。
2目标检测的意义
目标检测的意义目标检测是计算机视觉的一个热门研究方向,广泛应用于自主导航,智能视频监控,工业检测,航空航天等诸多领域。通过计算机视觉降低对人力资源的消耗,具有重要的科研意义。同时,目标检测也是身份识别领域的基础,对姿势估计以及将要学到的人脸识别有着不可分割的联系。2
3目标检测的常用方法
目标检测的常用方法目标检测大致分为两个方向:基于传统的目标检测算法和基于深度学习的目标检测算法。1.基于传统的目标检测算法在利用深度学习做物体检测之前,传统算法对于目标检测通常分为3个阶段:区域选取、特征提取和体征分类。3
目标检测的常用方法2.基于深度学习的目标检测算法目标检测任务可分为两个关键的子任务:目标分类和目标定位。目标分类负责判断所选区域是否有感兴趣类别的物体出现,输出一系列带分数的标签,表明感兴趣的物体在所选区域出现的可能性。目标定位负责确定所选区域感兴趣类别物体的位置和范围,通常存储在称为BoundingBox中。基于深度学习的目标检测算法大概分为两类:one-stage目标检测算法,two-stage目标检测算法。3
目标检测的常用方法one-stage目标检测算法可以在一个阶段内直接产生物体的类别概率和位置坐标值,相比于two-stage目标检测算法不需要产生候选阶段,将目标框的定位问题转化为回归(regression)问题,整体流程比较简单。one-stage在神经网络的尾部展开,成为classification+regression模式。常见的one-stage算法有YOLO、SSD等等。3two-stage算法在第一步特征提取后会生成一个有可能包含待检测物体的候选区域(RegionProposal,RP),第二步通过卷积神经网络进行分类和定位回归。常见的two-stage算法有R-CNN(区域卷积神经网络)、SPP-Net、FastR-CNN(快速区域卷积神经网络)、FasterR-CNN(更快区域卷积神经网络)等,此类算法以准确率高为特点。
ThankYOU!
基于YOLOv3的目标检测
案例描述01任务案例目标02任务案例分析03任务案例实施04任务
1案例描述
1案例描述通过上述对目标检测方法的讲解,下面将对一个实例进行实操练习。本案例将学习如何使用预训练的YOLOv3模型权重实现测试图片中的物体检测,其中YOLOv3是属于目标检测深度学习中的one-stage算法。
2案例目标
案例目标了解YOLOv3目标检测模型的网络组成;调用目标检测中YOLOv3预训练模型;使用YOLOv3模型对图片进行目标检测。2
3案例分析
案例分析YOLOv3是YOLO(YouOnlyLookOnce)系列目标检测算法中的第三版,相比之前的算法,尤其是针对小目标,精度有显著提升。YOLOv3算法使用的骨干网络是Darknet53。3Darknet53网络的具体结构如图所示,在ImageNet图像分类任务上取得了很好的成绩。在检测任务中,将图中C0后面的平均池化、全连接层和Softmax去掉,保留从输入到C0部分的网络结构,作为检测模型的基础网络结构,也称为骨干网络。YOLOv3模型会在骨干网络的基础上,再添加检测相关的网络模块。
3案例分析YOLOv3算法的基本思
文档评论(0)