- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HOG特征和SVM分类器行人检测研究
基于HOG特征和SVM分类器行人检测研究
摘 要:行人检测目前是机器视觉领域研究中一个热门技术。文章利用梯度直方图特征和支持向量机对不同场景下的样本图片进行检测。检测结果表明:在真实的应用场景中,该方法可以满足大部分的行人检测需求,但不同的光照、不同的遮挡和不同的样本复杂度对检测结果有一定影响。
关键词:HOG特征;SVM分类器;行人检测
行人检测技术是计算机视觉领域中的一个重要的分支,在智能交通、智能监控、行人行为分析以及智能机器人领域有着广泛的应用,是通过判断图片或视频序列中是否有行人出现,并给出准确位置的一项图像理解技术。行人检测主要分两大类方法[1]分别为基于背景建模的方法[2]和基于统计学习的方法[3]。前者主要利用图像差分的思想,分割出前景,提取其中的运动目标,从而达到目标检测的目的。该方法对背景的要求比较苛刻,在下雨、下雪、背景中树叶的晃动、光线不稳定的场景中该方法的抗干扰能力较差。基于统计学习的方法,首先对目标进行特征提取,然后训练相应的分类器,再通过滑窗技术,把训练好的分类器应用于图像中,检测用户感兴趣的目标[4]。文章使用基于统计学习的方法利用HOG特征和SVM分类器进行行人检测。
1 行人检测原理
1.1 梯度直方图特征描述
梯度直方图特征主要是用来描述图像局部重叠区域的一种描述符,将图像中局部区域像素的梯度方向直方图来做为人体的特征,该特征可以很好的描述出人体的边缘,并且不敏感于光照条件和微小的偏移。
图像中任意一像素点(x,y)的梯度表示为:
(1)
其中Gx(x,y)、Gy(x,y)和H(x,y)分别表示图像中在(x,y)处的水平方向梯度、垂直方向梯度和像素值。像素点(x,y)处的梯度幅值和梯度方向分别由下面公式计算可得:
(2)
在梯度直方图特征-简称HOG的提取过程中,Dalal曾提出:对于一个样本图像,我们可以将它看成若干个像素的单元,图像像素的梯度方向平均可以分割为9个区间,用直方图来统计每个像素单元里面所有像素梯度方向的所有方向区间,这样就可以得到一个比较直观的9维特征向量,块是由每4个相邻的单元构成,再把这个块中4个特征向量连接起来,就可以得到方便理解的36维特征向量,然后以一个单元作为步长用块进行扫描样本图像,最终串联起所有块的特性,人体特征就得到了。
上面所提出提取HOG特征来获取人体特征可以用于行人检测中,而这只是其中一个步骤,还有彩图转灰度,亮度校正等一系列步骤。综上,在用于行人检测过程中,HOG特征的计算步骤如下:
首先,将一个彩色的样本图像转为一个灰度图,并做归一化处理即采用Gamma校正法标准化输入图像的颜色空间,归一化的目的是为了调整样本图像的对比度,进而减少日光照射变化和样本图像的局部阴影所带来的影响,与此同时也有利于约束噪音的干扰;其次,计算梯度:这个步骤的目的是为了捕捉样本图像的边缘信息,进一步降低日照的干扰;再次,将梯度映射到像素单元的梯度方向:这样的目的是对局部样本图像提供一个编码;然后,归一化每个块上的所有单元格:标准化颜色空间可以更深层次地紧缩日照、阴影以及轮廓,一般情况下,几个不同的块可以会同享一个单元格,但是单元格的归一化在取决于不同块的,故而这样计算出的结果会不同,因此,我们最终所看到的向量中会呈现一个单元格特征的不同结果。HOG描述符也即标准化之后的块描述符;最后,一步就是将监测空间所有块的梯度直方图特征手整理起来:图像检测中我们会对所有块的交汇进行检测,这一步就是对其做HOG特征的整理,并将它们收集成最后的特征向量可供分类操作。
1.2 SVM分类器
SVM分类器可用于支持向量机算法,建立在样例线性可分的情况下,我们所说的支持向量机SVM就是从其最优分类面提出,而所谓的最优分类面就是:将不同的分类用线无差错地隔开,以保证经验风险最小,最小值为0,这样可以获取到很多的分类线,其中不同分类间距最大的分类线就是最优分类线。而通过下面的论述我们就可以看到,要求分类间距最大其实就是为了让推广行中的置信范围为最小,进而推广到高维空间,这样我们所得到的最优分类线就成为了最优分类面。
支持向量机就是基于最优向量面的思想训练出的一种分类算法,通俗一点来讲,他就是一个两类分类模型,会依赖预处理后的数据,最终可转化为一个凸二次规划问题的求解,在n维空间中找到一个分类超平面,将空间上的点分类。如图,是线性分类的例子。
图1 支持向量机线性分类
图中的实心圆点和空心圆点分别表示两个不同的分类,H就是将两个分类无错误的分割,并保证分类间距最大的最优分类面,从图像中我们不难看出,当用H分类面将两类分割开时,误差小,分割面到不同类的间距也最大。而上图中的H1,H2就
原创力文档


文档评论(0)