基于YOLOv3剪枝模型的姿态和步态识别算法研究.pdfVIP

下载本文档

1
0
约7.72万字
约 57页
2025-11-17 发布于广东
举报
版权申诉

基于YOLOv3剪枝模型的姿态和步态识别算法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

在计算机视觉的模式识别中，目标检测是一个非常具有挑战性并且极具现实意义的的研

究方向。多人姿态估计作为计算机视觉领域的一个重要组成部分，也影响着很多其它研究方

向，包括但不限于人机交互、体感技术等。随着当下全球化的趋势愈加明显，安全问题也日

益严峻，相比较于其它用于伪装身份的方法，步态由于其不可伪装性、远距离性等特点成为

了当下各国安全的研究重点。近年来，随着计算机软硬件的大力发展和数据量的爆炸式增长，

深度学习在计算机视觉领域表现十分优异，基于深度学习的多人姿态估计和步态识别方法也

在各个领域发挥出重要的作用。

论文首先介绍了多人姿态估计和步态识别技术的研究背景和意义，详细阐述了国内外的

研究现状，包括主流的步态识别算法，并对当前技术存在的问题进行了分析；随着卷积神经

网络和深度学习在计算机领域的大放光彩，论文仔细介绍了深度学习的基本理论知识和重要

概念。本文主要展开了以下两方面的工作和创新：

(1)首先提出了基于YOLOv3（YouOnlyLookOncev3）的多人姿态估计算法（YOLOPose

Estimator,YLPE），针对算法存在的参数量过大和计算冗余等问题，进一步提出了基于模型剪

枝的多人姿态估计算法（YOLOv3PrunePoseEstimator,YLPPE）。该算法采用自顶向下框架，

利用YOLOv3网络对多人图片进行人体目标检测，将检测所得人体包围框通过裁剪、补零等

操作生成新的256256大小的单人图片，最后将单人图片依次输入堆叠沙漏网络（Stacked

HourglassNetwork,SHN）进行人体关节点检测，并利用中心点回归法则将检测到的关节点回

归至原始图片。该算法利用批量归一化（BatchNormalization,BN）层的缩放因子对YOLOv3

网络进行循环迭代式通道剪枝，给BN层的每一个通道引入缩放因子，将缩放因子较小的通

道视为冗余通道并移除，从而大幅降低网络的整体计算量。通过对剪枝后模型进行实验验证，

YOLOv3剪枝模型参数量下降46%，但精度只下降了0.5%。YLPE算法在MPII数据集上达

到了84.1mAP，而YLPPE算法为83.7mAP。同时，算法与DeeperCut模型、RMPE模型等进

行比较也获得了较为明显的精度领先。

(2)提出了基于HP-GSI融合的步态识别算法。当前步态识别的主流方法是基于人体姿态

（HumanPosture,HP）和基于步态轮廓图(GaitSilhouetteImage,GSI)两类，前者存在关节点定

位不准确等问题，而后者受行人穿着和视角影响较大，针对上述问题论文提出了一种基于HP-

GSI融合的步态识别算法，其中算法所用数据集是由YLPPE算法对原始CASIA-B步态数据

集进行图片尺寸裁剪和关节点信息提取所得。算法基于卷积神经网络实现的HP步态识别模

块和GSI步态识别模块，其中，模块分别采用了集合池化（SetPooling,SP）层结合完整步态

周期图片特征，从而获得步态的时序特征。将视频分别输入这两个模块获得识别置信度和识

别结果，再采用改进AND的决策层特征融合方法，得到最终检测结果。基于HP-GSI融合的

行人步态识别算法在CASIA-B数据集上达到了75.8mAP，相比较于单独识别模块有了一定提

升，证明了特征融合的有效性。

关键词多人姿态估计，步态识别，深度学习，模型剪枝，特征融合

ABSTRACT

Inthepatternrecognitionofcomputervision,targetdetectionisaverychallengingandrealistic

researchdirection.Asanimportantpartofcomputervision,multi-personposeestimationalsoaffects

manyotherresearchdirections,includingbutnotlimitedtohuman-computerinteractionand

somatosensorytechnology.Withthetrendofglobal

您可能关注的文档

文档评论（0）

拥有快乐的你 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于YOLOv3剪枝模型的姿态和步态识别算法研究.pdfVIP