基于YOLOv3剪枝模型的姿态和步态识别算法研究.pdfVIP

基于YOLOv3剪枝模型的姿态和步态识别算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

在计算机视觉的模式识别中,目标检测是一个非常具有挑战性并且极具现实意义的的研

究方向。多人姿态估计作为计算机视觉领域的一个重要组成部分,也影响着很多其它研究方

向,包括但不限于人机交互、体感技术等。随着当下全球化的趋势愈加明显,安全问题也日

益严峻,相比较于其它用于伪装身份的方法,步态由于其不可伪装性、远距离性等特点成为

了当下各国安全的研究重点。近年来,随着计算机软硬件的大力发展和数据量的爆炸式增长,

深度学习在计算机视觉领域表现十分优异,基于深度学习的多人姿态估计和步态识别方法也

在各个领域发挥出重要的作用。

论文首先介绍了多人姿态估计和步态识别技术的研究背景和意义,详细阐述了国内外的

研究现状,包括主流的步态识别算法,并对当前技术存在的问题进行了分析;随着卷积神经

网络和深度学习在计算机领域的大放光彩,论文仔细介绍了深度学习的基本理论知识和重要

概念。本文主要展开了以下两方面的工作和创新:

(1)首先提出了基于YOLOv3(YouOnlyLookOncev3)的多人姿态估计算法(YOLOPose

Estimator,YLPE),针对算法存在的参数量过大和计算冗余等问题,进一步提出了基于模型剪

枝的多人姿态估计算法(YOLOv3PrunePoseEstimator,YLPPE)。该算法采用自顶向下框架,

利用YOLOv3网络对多人图片进行人体目标检测,将检测所得人体包围框通过裁剪、补零等

操作生成新的256256大小的单人图片,最后将单人图片依次输入堆叠沙漏网络(Stacked

HourglassNetwork,SHN)进行人体关节点检测,并利用中心点回归法则将检测到的关节点回

归至原始图片。该算法利用批量归一化(BatchNormalization,BN)层的缩放因子对YOLOv3

网络进行循环迭代式通道剪枝,给BN层的每一个通道引入缩放因子,将缩放因子较小的通

道视为冗余通道并移除,从而大幅降低网络的整体计算量。通过对剪枝后模型进行实验验证,

YOLOv3剪枝模型参数量下降46%,但精度只下降了0.5%。YLPE算法在MPII数据集上达

到了84.1mAP,而YLPPE算法为83.7mAP。同时,算法与DeeperCut模型、RMPE模型等进

行比较也获得了较为明显的精度领先。

(2)提出了基于HP-GSI融合的步态识别算法。当前步态识别的主流方法是基于人体姿态

(HumanPosture,HP)和基于步态轮廓图(GaitSilhouetteImage,GSI)两类,前者存在关节点定

位不准确等问题,而后者受行人穿着和视角影响较大,针对上述问题论文提出了一种基于HP-

GSI融合的步态识别算法,其中算法所用数据集是由YLPPE算法对原始CASIA-B步态数据

集进行图片尺寸裁剪和关节点信息提取所得。算法基于卷积神经网络实现的HP步态识别模

块和GSI步态识别模块,其中,模块分别采用了集合池化(SetPooling,SP)层结合完整步态

周期图片特征,从而获得步态的时序特征。将视频分别输入这两个模块获得识别置信度和识

别结果,再采用改进AND的决策层特征融合方法,得到最终检测结果。基于HP-GSI融合的

行人步态识别算法在CASIA-B数据集上达到了75.8mAP,相比较于单独识别模块有了一定提

升,证明了特征融合的有效性。

关键词多人姿态估计,步态识别,深度学习,模型剪枝,特征融合

ABSTRACT

Inthepatternrecognitionofcomputervision,targetdetectionisaverychallengingandrealistic

researchdirection.Asanimportantpartofcomputervision,multi-personposeestimationalsoaffects

manyotherresearchdirections,includingbutnotlimitedtohuman-computerinteractionand

somatosensorytechnology.Withthetrendofglobal

文档评论(0)

拥有快乐的你 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档