基于深度学习的目标检测算法研究.pdfVIP

下载本文档

143
0
约11.95万字
约 81页
2020-08-28 发布于江苏
举报
版权申诉

基于深度学习的目标检测算法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要摘要深度学习，作为人工智能一个重要的分支，现在受到人们越来越多的关注，而目标检测这个计算机视觉的基础性研究领域也因为深度学习的快速发展焕发出了新的活力。目标检测即是在图像或者视频中找到目标物体的位置，并确定物体的类别。由于图像中目标的形态和大小不一，数量和位置不定，这使得目标检测一直是计算机视觉检测领域的难题之一。传统的目标检测采滑动窗口和图片缩放的方式，这种方式检测效率差，精度低，为了改善传统检测算法的弊端，将深度学习和目标检测相结合的方法应用而生。基于深度学习的目标检测算法主要分为两种，一种是以R-CNN 系列为代表的two- stage 目标检测算法，这类算法要先产生候选区域，然后再对候选区域进行分类和边框位置的修正，另一种是以SSD、YOLO 等为代表的基于回归的one-stage 目标检测算法，这类算法不需要产生候选区域直接对目标物体进行回归。本文主要针对Faster R-CNN 和 SSD 两种目标检测算法进行了深入研究，具体内容如下： (1) 对深度学习技术和目标检测算法展开了研究，分析了卷积神经网络和常用目标检测技术的工作原理。 (2) 通过从网络结构、锚框的生成和训练流程来对Faster R-CNN 的算法原理进行了深入研究。针对原算法存在的一些问题，本文在原网络结构中加入了特征金字塔网络，并对目标类别的分类标签进行了优化。此外还对实验的训练图像进行不同的变换来扩充数据集，这些使得原算法的检测效果得到了优化。 (3) 研究了SSD 算法，对SSD 的整体结构、先验框的生成、先验框的匹配和难分样本挖掘以及损失函数等原理进行了深入分析。为了改进原算法，一是在原算法的网络基础上加入了Top-Down 模块，二是优化了分类损失，三是使用了Soft-NMS 算法。 (4) 在计算机平台上使用了深度学习框架MXNet 对Faster R-CNN 算法和SSD 算法进行了改进前和改进后的训练实验，并对实验的检测结果进行了分析，结果显示检测效果改进后相比改进前得到了提高。关键词：目标检测，深度学习，卷积神经网络，Faster R-CNN，SSD I Abstract Abstract Deep learning, as an important branch of artificial intelligence, is now attracting more and more attention, and target detection, a basic research field of computer vision, has also shown new vitality due to the rapid development of deep learning. Target detection is to find the position of the target object in the image or video and determine the category of the object. Due to the different shapes, sizes, numbers and positions of targets in images, target detection has always been one of the difficult problems in the field of computer vision detection. Traditional target detection adopts sliding window and image scaling, which has poor detection efficiency and low accuracy. In order to improve the disadvantages of traditiona