图像梯度 方向直方图描述子.pptVIP

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重叠块: Datal等人在他们那篇关于HOG最为经典的论文《Histogram of Oriented Gradient for Human Detection》提出了利用块与块的重叠(Overlap)来解决混叠,并且取得了不错的效果。 在重叠方式中,块与块之间的边缘点被重复根据权重投影到各自相邻块(block)中,从而一定模糊了块与块之间的边界,处于块边缘部分的像素点也能够给相邻块中的方向梯度直方图提供一定贡献,从而达到关联块与块之间的关系的作用。Datal对于块和块之间相互重叠程度对人体目标检测识别率影响也做了实验分析。 利用线性插值的方法解决分块之间联系问题 利用线性插值的方法解决分块之间联系问题: 有些文献采用的不是块与块重叠的方法,而是采用线性插值的方法来削弱混叠效应。这种方法的主要思想是每个Block都对临近的Block都有影响,这种影响,我们可以以一种加权方式附加上去。 基于线性插值的基本思想,对于上图四个方向(横纵两个45度斜角方向)个进行一次线性插值就可以达到权重分配目的。下面介绍一维线性插值。假设x1和x2是x块相邻两块的中心,且x1<x<x2。对w(即权重,一般可直接采用该block的直方图值即h(x))进行线性插值的方法如下式: 其中b在横纵方向取块间隔,而在斜45度方向则可采用sqrt(2)倍的块间隔。 Step 4:HOG特征向量归一化 我们要对block块内的HOG特征向量进行归一化。对block块内特征向量的归一化主要是为了使特征向量空间对光照,阴影和边缘变化具有鲁棒性。还有归一化是针对每一个block进行的,一般采用的归一化函数有以下四种: 在人体检测系统中进行HOG计算时一般使用L2-norm,Dalal的文章也验证了对于人体检测系统使用L2-norm的时候效果最好。 HOG最终的特征向量生成 Step 5 HOG最终的特征向量生成 LOGO 图像像素的应用时,我们往往忽略了像素之间的关系,比如在实际人脸识别应用中,我们往往直接将图像像素点一行一行的提取组成一个高维的向量,这时我们就忽略了像素之间列与列的关系,这就一定程度上降低最终人脸识别的结果。新的描述子也能去除掉图像中对于我们没有用信息,强调我们感兴趣的数据。 图像归一化一般采用Gamma标准化,在Dalal文章提到,使用gamma均衡对图像进行归一化,对效果并没有太大的影响,估计是算法后面block块内归一化消除了这部分的影响。所以对于图像归一化的步骤是可有可无,我将不会详述。 对于灰度图像,一般为了去除噪点,所以会先利用离散高斯平滑模板进行平滑:高斯函数在不同平滑的尺度下进行对灰度图像进行平滑操作,Dalal等实验表明在下,人体检测效果最佳(即不做高斯平滑),使得错误率缩小了约一倍。不做平滑操作,可能原因:图像时基于边缘的,平滑会降低边缘信息的对比度,从而减少图像中的信号信息。 在描述符计算时,把扫描图像的窗口分割成密集统一的网格点,以每个网格点为中心,将其周围的像素点“区域”分成“单元”。其中每个区域(block)包括个单元(cells),而每个单元又包括个像素点(pixels),每个单元也包括个方向角度(orientation bins)。 梯度方向平均地分布在单元格(Cell)的空间里,对于无符号的梯度值分布空间为0~180度,而对于有符号的梯度值分布空间为0~360度。根据Dalal等人实验,在人体目标检测中,在无符号方向角度范围并将其平均分成9份(bins)能取得最好的效果,当bin的数目继续增大效果改变不明显,故一般在人体目标检测中使用bin数目为9范围0~180度的度量方式。 这里的要举个例子 从图中可以看出在重叠部分越大,效果越优,但是,如果根据cell,block尺度不变的情况下,则导致最后得出的特征向量维度大幅将提高(因为块与块之间的重叠,block的数目积增),不过如果对于引入重叠时,cell与block的大小也随之增大,则不会增加最后特征向量的维数。还有虽然Datal等人没提到Cell之间的重叠,不过本人觉得在独立块(Block)中Cell也可以做重叠,而且因为一个Block之间像素点因为联系的更紧密,而效果应该显著。 PPT模板集编辑说明 本模板文件只是整个模板集的一部分,包含各种风格和用途,后面也会一直陆陆续续的更新,这是模板适合多个场合,按照需要获取,使用灵活方便,排版及各个字体限制已经设置好,可以直接使用也可以自动以使用 图像梯度方向直方图描述子 重庆大学行业信息化工程中心 黄晟 图像表征 什么是图像的描述子? 其实图像描述子就是图像的一种表征形式,我们所熟知的像素值便是最常见最朴素的一种图像表征形式,也可以被看成一种描述形式。 既然已经存在像素这种描述子,为何我们还有寻

文档评论(0)

159****1262 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档