“LOG颜色空间不变性用于行人识别”研发文档3.docVIP

“LOG颜色空间不变性用于行人识别”研发文档3.doc

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
LOG颜色空间不变性用于行人识别 郭涛 今日任务: 测试对于黑白灰目标,采用减小取形状上下文时的角度划分量来进行搜索的效果。 对于上述方法产生的大量误检,大多为背景区域,其纹理与原始目标(行人)会有差异,因此采用梯度方向直方图(HOG)的方法来提取目标和检测结果的纹理特征,通过对比HOG纹理特征来区分行人和背景,从而滤除大部分目标。 实验一: 对于如下目标: 之前在取形状上下文特征时,角度量化为16份,检测效果如下: 出现误检或者检测效果不好,这是由于光照的变化使随机点在LOG颜色空间中区域发生了旋转,因此减小角度量化为8份之后,可以检测到目标,但是误检很多,如下图所示: HOG特征: 从上面的实验结果可以发现,误检大多数集中在背景区域,其纹理与原始目标(行人)会有差异,可以采用梯度方向直方图(HOG)的方法来提取目标和检测结果的纹理特征。 HOG特征优点是它是在图像的局部细胞单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。其次,它在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化,可以保证只要行人大体上能够保持直立的姿势,就容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。 使用HOG特征滤除误检,我的做法是首先提取原始目标和误检区域的HOG特征,然后使用HOG特征间的欧氏距离来区分,这里没有使用一般常用的SVM方法,实验发现,检测效果也很明显,如下图所示: A、 原始搜索结果: HOG特征滤除误检: B、 原始搜索结果: HOG特征滤除误检: C、 原始搜索结果: HOG特征滤除误检: D、 原始搜索结果: HOG特征滤除误检: E、 原始搜索结果: HOG特征滤除误检: F、 原始搜索结果: HOG特征滤除误检: G、 原始搜索结果: HOG特征滤除误检: 上面实验可以发现,HOG特征确实可以有效的滤除误检,但A、B中仍会有部分误检,影响搜索结果,需要对HOG特征进行优化,得到更好的滤除误检效果。 HOG特征的一些问题: 对于行人比较密集的图像,使用HOG特征会检测出许多与原始目标形状相似的行人,如果这些行人的颜色特征与原始目标很相似,理论上还是会有许多误检。 添加HOG特征仍不能区分形状相似的黑白灰行人。 郭涛 今日任务: 优化提取的HOG特征,增加block数目;优化提取形状上下文时的角度量化值,对于上下颜色相似的目标,角度量化为10份; 尝试使用Matlab并行计算工具箱提升图像搜索效率; 算法优化: 之前将一幅目标图像划分为3*3个block,现在划分为6*3个,排除一些背景纹理与行人相似的目标; 对于上下颜色相似的目标,之前角度量化为8份,现在增加到10份,减少部分误检。 下面为优化后的算法图像搜索结果,相比之前的算法,搜索效果有所提升,但提升不大: 目标为: HOG特征筛选前: HOG特征筛选后: HOG特征筛选前: HOG特征筛选后: Matlab 并行工具箱: 搜索时使用parfor语句代替for语句,将搜索过程分到2个进程中执行,可以充分利用CPU资源,之前程序运行时CPU占用率为52%左右,使用并行工具箱后,CPU占用率达到100%,理论上来说可以提升效率约2倍,实际执行耗时与之前耗时相比相差不大。 Parfor语句要求每一次循环都是相互独立的,需要特殊的变量定义方式,在将普通for语句转化为parfor语句时,增加和修改了许多变量,这可能是造成效率不高的一个原因,需要改善。 郭涛 今日任务: 提升LOG颜色空间不变性行人识别算法执行效率,使用测试机(4核)执行,新算法耗时仅为原算法的1/5; 使用更多样本测试新算法的图像搜索效果。 效率提升: 所做的优化: 优化for循环,Matlab中将二重循环转化为单重循环; 使用Matlab并行计算工具箱,用parfor代替for,在测试机(4核心)上执行; 下表为搜索一张图片,用四种方法的耗时对比,可见,“for循环优化+并行”执行效率最高,耗时仅为原算法的1/5。   第一次 第二次 第三次 平均 与原始算法对比 原始算法 49.21259 37.42866 32.5097 39.71698 100% for循环优化 27.6833 17.60857 23.99575 23.09587 58.15% 原始算法+并行 8.4708 10.77365 12.21079 10.48508 26.40% for循环优化+并行 8.373357 6.494756 7.415887 7.428 18.70% 实验结果: 分别对以下目标进行搜索: A1、近 A2、遮挡 A3、远 B1、近 B2、较大形

文档评论(0)

zilubuyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档