- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第1页
利用注意力机制提升FasterR-CNN对遮挡行人检测效能研究
目录
摘要 2
第一章前言 2
1.1研究背景及意义 2
1.2国内外研究现状 3
第二章相关理论知识 6
2.1WiderPerson行人检测数据集 6
2.2卷积神经网络 8
2.3相关评价参数 11
2.3.1精准率、准确率、召回率、交并比 11
2.3.2行人检测评价指标 11
2.4本章小结 12
第三章FasterR-CNN算法 12
3.1FasterR-CNN算法原理 12
3.2FasterR-CNN算法流程 15
3.3算法流程中相关结构的理论介绍 16
3.3.1主干特征提取网络 16
3.3.2RPN网络 19
3.3.3ROIPooling层 19
3.3.4分类预测和回归预测 20
3.4本章小结 20
第四章实验设计与结果分析 20
4.1实验目的 21
4.2实验环境介绍 21
4.3实验设计 21
4.3.1主干特征提取网络的设计 21
4.3.2注意力机制的设计 21
4.3.3损失函数的设计 22
4.4实验过程 23
4.5实验结果与分析 24
4.5.1训练过程 24
4.5.2预测过程 25
4.5.3评估过程 27
4.6本章小结 28
第五章总结与展望 28
5.1研究总结 28
5.2期望 29
参考文献 29
第2页
摘要
行人检测技术一直都备受人们关注,这是因为它的价值能够体现在很多日常的领域当中。近年来深度学习技术的崛起,使得输入进来的数据特征能够被提取得更加完好,以至于行人检测技术的应用领域更为广泛。不过,由于检测场景越来越复杂,现有的检测算法并不能很好地满足需求,对密集场景下被遮挡行人的检测效果并不是很完美。本文主要通过比对主干网络、添加注意力机制来实现FasterR-CNN算法的改进。
本次实验中使用resnet50和vgg16作为该算法框架中的主干网络,使用WiderPerson数据集完成本次实验的训练、预测和评估。本次实验中考虑主干网络是否会对检测的结果产生影响,结果表明主干网络为vgg16时能够更好地去识别被挡住的行人。同时,在该算法的主干网络中添加注意力机制,添加的地方位于得到特征图的后面。这种做法使得网络能够聚焦于输入进来的关键性数据信息,从而提高该算法对于被遮挡行人的识别精度。结果表明添加注意力机制后,该算法对于被遮挡行人的识别精度有了提升。
关键字:密集场景,行人检测,FasterR-CNN
第一章前言
1.1研究背景及意义
对计算机的视觉任务这一概念的阐述是论述行人检测的大前提。它简单地说就是一门关于研究使用某些电子设备去完成人的眼睛功能的科学学科,而这门学科研究的内容是“某些电子设备是使用什么方法去感受、去观察这个世界的”。在这类任务中比较重要的一个就是对目标的检测,它会把检测目标的识别和分割这两任务组合在一起。
行人检测技术可以被当成是目标检测的一个特别的例子,该技术专门以行人为目标,它是一种要利用某些电子设备来获取行人在视频帧或单帧图片中的准确位置,并且会用矩形框标定出视频帧或单帧图片中的行人的位置和大小的视觉任务(陈天羽,成佳怡,2022)。此外,对于行人检测2]算法的研究也对许多研究课题是至关重要的,比如说目标的跟踪与识别以及人体姿态的估计等(张奇雨,陈羽和,2023)。同时,行人检测技术
第3页
也广泛地应用在如车辆的自动驾驶等领域当中。具体如,近年来大街上的车辆变得越来越多,从这些技术可以看明白但因这种情况而带来的交通事故发生的数量也在逐年的增加。而行人检测技术中的一个名为智能驾驶的应用就可以很好地减少这种事故的发生次数,这个应用是通过使用将位于车辆前后方的物体和人体检测出来的方法来减少这类事故的发生(张雨向,赵君阳,2021)3]。
图形处理单元(GPU)在不断革新的过程中会使得电脑的计算数据的能力不断地增强(张文天,黄婧怡,2021)。同时,如今的电脑在处理图像数据的时候有了更为可靠的硬件支持,这在一定范围上展示而且在计算机视觉等领域也广泛地去应用深度卷积神经网络(CNN)等技术。也就是由于这些计算机软件和硬件技术的不断革新,行人检测才能够得以快速地发展。
目前,在密集场景下有可能会存在检测行人被挡住的情形
您可能关注的文档
- 山山水水(教学设计)人美版2025美术一年级下册 .docx
- 企业培训师职业技能考试题(附答案) .pdf
- 2025年管工(高级)职业技能鉴定参考试题(附答案) .pdf
- 《舞蹈基础及创编》核心备考试题(附答案) .pdf
- 一年级心理健康上册第一课《我喜欢上学》教学设计-北师大版 .pdf
- 2025年钢筋工(高级)职业技能鉴定参考试题(附答案) .pdf
- 2015-2024年高考理科数学真题优质模拟试卷试题及答案解析新高考卷与全国理科卷专项练习题集(概率统计解答题) .pdf
- 三年(2022-2024)中考化学真题分类汇编(全国)专题13质量守恒定律和化学方程式(解析版) .pdf
- 2024年淄博市张店区卫生健康系统事业单位招聘笔试真题 .pdf
- 5.15 生物与非生物(教学设计)-四年级科学下册(苏教版) .pdf
文档评论(0)