- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HOG研究报告汇编
HOG特征提取
摘要:
关键
1. 引言
方向梯度直方图是一种用于目标检测的特征描述子,广泛应用在计算机视觉和图像处理领域。在2005年被Navneet Dalal和Bill Trigg提出,并用在行人检测中,取得了显著的效果。作者是法国国家计算机技术和控制研究所French National Institute for Research in Computer Science and Control (INRIA)的研究员后来他们也将其应用在电影和视频中的行人检测,以及静态图像中的车辆和常见动物的检测。
2 国内外研究现状
3. 方法
HOG的基本思想是利用局部图像的密集梯度特征,体现图像中物体的边缘特征,在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述。具体的实现方法是:首先将图像分成小的连通区域即细胞单元(cell)。然后采集细胞单元中各像素点的梯度或边缘的方向直方图。最后,把这些直方图组合起来就构成了特征描述子。为了提高性能,把这些局部直方图在图像的更大范围内即区间(block)进行对比度归一化(contrast-normalize)。所采用的方法是,首先计算各直方图在这个区间中的密度,然后根据这个密度对区间中的各个细胞单元作归一化。通过这个归一化后,能对光照变化和阴影获得更好的效果。
与其他特征描述子比较,HOG描述子有很多优点,首先,由于HOG是在图像的局部细胞单元上进行操作,所以它对图像几何的和光学的形变都能保持良好的不变性,这两种形变只会出现在更大的空间领域上。其次,原文作者通过实验发现,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体保持直立姿势,就容许行人有一些细微的肢体动作,这些细微动作可以被忽略而不影响检测效果。综上所述,HOG方法是特别适合做图像中的行人检测的。
下面,我们按照HOG的计算过程,梯度计算,三维线性插值和区域对比度标准化,对每个部分进行详细分析。
3.1 梯度计算
梯度是一个数学名词,在向量微积分中,标量场的梯度是一个向量场。标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这个最大的变化率。更严格的说,从欧几里得空间Rn到R的函数的梯度是在Rn某一点最佳的线性近似。在这个意义上,梯度是雅可比矩阵的一个特殊情况。
在单变量的实值函数的情况,梯度只是导数,或者,对于一个线性函数,也就是线的斜率。梯度一词有时用于斜度,也就是一个曲面沿着给定方向的倾斜程度。可以通过取向量梯度和所研究的方向的点积来得到斜度。梯度的数值有时也被称为梯度。
。在技术上,它是一个离散的一阶算子,用来计算图像亮度函数的一阶梯度之近似值。在图像的任何一点使用此算子,将会产生该点对应的梯度矢量或是其法矢量。θ(x,y)代表梯度的方向。如图1所示,在梯度算子为[-1,0,1]时,点A5的水平梯度为A6-A4,垂直方向的梯度幅值为A8-A2。
图1 3×3图像示意图
在 Dalal的论文中,对各种平滑函数做了评估。 计算梯度前的平滑会严重影响检测效果。对于高斯平滑函数,从 方差为0到2会使误检率约增加1 倍,从 11%到 20%。梯度掩膜测试包括了行向量面罩、3 ×3的 Sobel掩膜和 2 ×2的对角掩膜。其中简单的[1 0 -1]行向量面罩的到的检测效果最佳且该面罩计算梯度最简单。采用2 ×2的对角掩膜、3×3的 Sobel掩膜和立方修正面罩做梯度计算会严重削弱检测准确率。非中心的面罩[1 -1]也表现不好,因为非中心的面罩会使x 方向和 y 方向的梯度偏向不同的中心。各梯度算子的比较如表1-1.使用其他形式的平滑滤波器和复杂的梯度算子都会削弱检测效果。造成这种现象的主要原因可能是图像中的规整信息对目标检测非常重要: 从根本上说 HOG 特征是基于边缘的,而平滑处理会削弱边缘信息。综上,最有 效的边缘信息可以通过简单快速地计算得到。 []
表1-1 各梯度算子比较
梯度算子 中心向量 非中心向量 立方修正向量 对角 Sobel 操作符 【1, 0,-1】 【1,-1】 【1, 8, 0,-8,-1】
3.2 三线性插值
3.2.1 HOG的区域划分
HOG 特征是在单元(cel1)和块(block)的网格内进行密集计算而得到,cell 由8×8个像素点构成,block由4个相邻的cell 组成,如图2所示。根据公式(5),每个单元的特征可由一个9维的向量表示,每个块由4个单元组成,从而每个块的特征可由一个36维向量表示,即大小为64×128的训练样本具有7×15=105个block。对于每个cell,由(1)-(4)式计算其中所有像素的梯度向量并按照(5)式进行投影,形成每个cell各自的梯度方向直方图
文档评论(0)