“LOG颜色空间不变性用于行人识别”研发文档5.docVIP

“LOG颜色空间不变性用于行人识别”研发文档5.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
LOG颜色空间不变性用于行人识别 郭涛 今日任务: 优化使用HOG纹理特征滤除背景的方法,使用libSVM训练得到一个行人和背景的分类器,用这个分类器对误检背景区域进行过滤,能够解决原来方法中对于形变太大的行人漏检问题; 测试新算法的图像搜索效果; LibSVM训练分类器: 正向样本:1000张 (CAVIARa数据集+之前实验所用的搜索目标); 负向样本:2500张 (从不含行人的背景图中截取); 特征使用之前算法中的HOG纹理特征,取HOG特征前,将每张图片缩小到60*30,并做2*2的中值滤波,排除噪点干扰; 使用libSVM训练时,svm_type 设置为0(C-SVC),kernel_type 设置为2(radial basis function: exp(-gamma*|u-v|^2)),cost 设置为100,其他为默认配置。 对于原来方法中形变太大的行人漏检问题使用该分类器能够很好的解决,如下图所示: 实验结果: 搜索目标分别为: A1、 A2、 B、 C、 D、 E1、 E2、 总结: 1.虽然HOG分类器能解决形变较大的行人漏检问题,但有时分类并不准确,产生误检,这需要更多的训练样本及更好的训练参数来调节; 2.有些误检是不可原谅的,如D和E1中上身白色,下身黑色的行人也被当做目标了,这种情况可以通过中上下部分随机点RGB平均值的比值来区分,有待实验验证; 3.对于E2中漏检的问题,昨天以为是背景点的影响,通过调节随机点的选取方法,使随机点呈高斯分布,发现背景点的影响不大,目标本身的颜色也会受到周围颜色的干扰,如下图所示,(1)中蓝色点R分量比较多,因此在LOG空间都偏向原点右侧,(2)中蓝色点R分量较少,在LOG空间都偏向原点左侧,整体来看,随机点在LOG颜色空间旋转了约180度,在提取形状上下文信息时需要将角度分量减小为2才可能匹配上,而这必将导致非常多的误检,EMD特征也没有什么意义了,因此,需要探索其他方法来解决这一问题: (1) (2) 郭涛 今日任务: 探索新方法对黑白灰目标进行搜索(使用RGB空间特征),测试新方法的图像搜索效果。 RGB空间特征: 由于黑白灰目标随机点在LOG颜色空间中的分布区域几乎相互重叠,很容易受周围环境的影响而发生旋转,旋转角度有可能会很大,因此对于黑白灰目标,使用LOG颜色空间不变性就没什么意义了,可以使用RGB空间特征来代替。 前提: 1、黑白灰目标所有像素点的RGB值很接近,即使某种分量值偏大,对R、G、B的比值改变不大; 2、对于上下身颜色不同的目标,比如上白下黑,可以使用上下部分亮度的比值来和其他目标相区别,比如纯黑、纯白、纯灰、上黑下白等;对于目标中的某一个像素,它的亮度与整幅图像亮度的比值,也可以作为该像素点的一个特征。 因此,对于图像中每一个像素点,构造如下五维特征: R/(R+G+B) G/(R+G+B) B/(R+G+B) V像素/V图像 V_UP/V_DN 特征之间的距离可以使用夹角余弦来衡量。 实际取特征时,首先对目标上下部分分别取随机点(与原始算法相同)N个,为了排除异常点的干扰,上下部分分别对每5个随机点取上述特征值的平均值,这样上下部分分别有N/5个五维特征向量,组合成一个Signture,用来代表目标的特征集,特征集之间使用EMD算法找到最优匹配,特征向量之间的距离使用夹角余弦。 搜索时可以对目标的亮度做限制,比如亮度变化大于50的就可以认为不匹配。 实验结果: 分别对以下目标进行搜索: A、 B1、 B2、 C1、 C2、 从上图可以看出,该特征能够检测到之前算法漏检的目标,B1、B2,但是造成很多误检,需要继续优化;部分与行人相差很大的误检,使用HOG纹理分类器也没能区分开,也需要提升HOG分类器的分类性能。

文档评论(0)

zilubuyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档