基于DPM人体检测.docVIP

下载本文档

5
0
约4.37千字
约 8页
2018-08-28 发布于福建
举报
版权申诉

基于DPM人体检测.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于DPM人体检测

基于DPM人体检测　　摘要： DPM算法利用图结构模型，构建了一个检测目标与模型的算法。本文通过使用DPM算法对随机的100幅含有人体的图片进行测试，检测整体准确率达到83%，而其中对于直立人体检测率精度较非直立人体检测精度更高。通过对标准数据集以外的人体图片的检测，进一步验证了DPM算法对人体检测的有效性。　　关键词：人体检测可变形部件模型图结构模型隐藏变量SVM 　　中图分类号：TP391 文献标识码：A 文章编号：1003-9082（2015）05-0007-02 　　一、引言　　人体检测是让计算机用人的思维把图片中的人体识别出来的一种技术。目前复杂背景下人体检测的研究取得了一定的成果，主流方法有方向梯度直方图法（Histograms of Oriented Gradient，HOG） [1]、形状上下文法（Shape Contexts） [2]、可变形部件模型法（deformable part models，DPM） [3]等。其中DPM算法是基于HOG算法改进而来。　　HOG核心思想是图像中物体表象和形状可以被像素强度梯度或边缘的方向分布很好地描述。HOG是在一个网格密集的大小统一的细胞单元上计算，为了提高性能，还采用了重叠的局部对比度归一化技术。HOG检测器在MIT的行人数据集上表现相当好，对于其他基于形状的目标检测表现也同样好。形状上下文是一种用直方图来表示的方法，对形状的轮廓非常敏感，易受噪声影响。DPM算法采用了改进后的HOG特征，支持向量机（Support Vector Machine，SVM）分类器和滑动窗口（Sliding Windows）检测思想，用多组件的策略解决目标的多视角问题；用基于图结构（Pictorial Structure）[3]的部件模型策略解决目标本身的形变问题。此外，将样本所属的模型类别，部件模型的位置等作为潜变量（Latent Variable），采用多示例学习（Multiple-instance Learning）[4]来自动确定。DPM可以表示各种多变的目标并且在PASCAL目标检测挑战赛上达到了目前最优结果[5]-[7]。　　由于人体姿势的不确定性和外表的多变性，例如，人可能穿不同的衣服，做不同的姿势，相对于其他的物体，把图像中的人体检测出来是一项比较困难的工作。本文将使用可变形部件模型（DPM）法对随机的100幅含有人体的图片进行测试。　　二、模型　　DPM模型主要有两种，星型结构的部件模型和混合星型结构的部件模型，下面将简要介绍两种模型。　　1.星型结构的部件模型　　星型模型由一个大体上覆盖整个目标的粗糙的根滤波器和覆盖目标中较小部件的高分辨率的部件滤波器构成。根滤波器定义了检测窗口（滤波器所覆盖的特征空间部分的像素），部件滤波器被放置在根所在层的λ层之下，该层特征的分辨率是根所在层的特征的两倍。　　实验发现用高分辨率特征来定义部件滤波器对获得高识别性能至关重要。用这种方法部件滤波器可以捕捉相对于根滤波器更精确定位的特征。例如建立人脸的模型，根滤波器捕捉的是人脸边界这些粗糙边缘信息，部件滤波器可以捕捉眼镜、鼻子、嘴这些细节信息。　　含有n个部件的目标模型可以形式上定义为一个元组：（F0，P1，……，Pn，b），F0是根滤波器，Pi是第i个部件的模型，b是表示偏差的实数值。每个部件模型用一个三元组定义：（Fi，vi，di），Fi，是第i个部件的滤波器；vi是一个二维向量，指定第i个滤波器的锚点位置（即未发生形变时的标准位置）相对于根的坐标；di是一个四维向量，指定了一个二次函数的参数，此二次函数表示部件的每个可能位置相对于锚点位置的变形花费。　　每个目标假设都指定了模型中每个滤波器在特征金字塔中的位置：z=（P0，…Pn），，其中pi=（xi ，yi ，li），li表示第i个滤波器所在的层和位置坐标。我们这里需要每个部件所在层的特征分辨率都是根滤波器所在层的特征分辨率的两倍，即 li层特征是 l0 层特征的分辨率的两倍，并且 li=l0-λ ，（l0）目标假设的得分等于每个滤波器在各自位置的得分（从数据来看）减去此位置相对于根位置的变形花费（从空间来看）再加上偏差值：　　给出了第i个部件相对于其锚点位置的位移：（x0，y0）是根滤波器在其所在层的坐标，为了统一到部件滤波器所在层需乘以2，vi是部件i的锚点相对于根的坐标偏移，所以表示未发生形变时部件i的绝对坐标（锚点的绝对坐标）。而　　是变形特征（水平、垂直位移及其平方）。　　如果 di=（0，0，1，1），则第i个部件的变形花费就是它实际位置与锚点位置距离的平方。通常情况下，变形花费是位移的任意可拆分二次函数。引入偏差值是为了在将多个