- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
LOG颜色空间不变性用于行人识别 郭涛
今日任务:
测试对于黑白灰目标,采用减小取形状上下文时的角度划分量来进行搜索的效果。
对于上述方法产生的大量误检,大多为背景区域,其纹理与原始目标(行人)会有差异,因此采用梯度方向直方图(HOG)的方法来提取目标和检测结果的纹理特征,通过对比HOG纹理特征来区分行人和背景,从而滤除大部分目标。
实验一:
对于如下目标:
之前在取形状上下文特征时,角度量化为16份,检测效果如下:
出现误检或者检测效果不好,这是由于光照的变化使随机点在LOG颜色空间中区域发生了旋转,因此减小角度量化为8份之后,可以检测到目标,但是误检很多,如下图所示:
HOG特征:
从上面的实验结果可以发现,误检大多数集中在背景区域,其纹理与原始目标(行人)会有差异,可以采用梯度方向直方图(HOG)的方法来提取目标和检测结果的纹理特征。
HOG特征优点是它是在图像的局部细胞单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。其次,它在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化,可以保证只要行人大体上能够保持直立的姿势,就容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。
使用HOG特征滤除误检,我的做法是首先提取原始目标和误检区域的HOG特征,然后使用HOG特征间的欧氏距离来区分,这里没有使用一般常用的SVM方法,实验发现,检测效果也很明显,如下图所示:
A、
原始搜索结果:
HOG特征滤除误检:
B、
原始搜索结果:
HOG特征滤除误检:
C、
原始搜索结果:
HOG特征滤除误检:
D、
原始搜索结果:
HOG特征滤除误检:
E、
原始搜索结果:
HOG特征滤除误检:
F、
原始搜索结果:
HOG特征滤除误检:
G、
原始搜索结果:
HOG特征滤除误检:
上面实验可以发现,HOG特征确实可以有效的滤除误检,但A、B中仍会有部分误检,影响搜索结果,需要对HOG特征进行优化,得到更好的滤除误检效果。
HOG特征的一些问题:
对于行人比较密集的图像,使用HOG特征会检测出许多与原始目标形状相似的行人,如果这些行人的颜色特征与原始目标很相似,理论上还是会有许多误检。
添加HOG特征仍不能区分形状相似的黑白灰行人。 郭涛
今日任务:
优化提取的HOG特征,增加block数目;优化提取形状上下文时的角度量化值,对于上下颜色相似的目标,角度量化为10份;
尝试使用Matlab并行计算工具箱提升图像搜索效率;
算法优化:
之前将一幅目标图像划分为3*3个block,现在划分为6*3个,排除一些背景纹理与行人相似的目标;
对于上下颜色相似的目标,之前角度量化为8份,现在增加到10份,减少部分误检。
下面为优化后的算法图像搜索结果,相比之前的算法,搜索效果有所提升,但提升不大:
目标为:
HOG特征筛选前:
HOG特征筛选后:
HOG特征筛选前:
HOG特征筛选后:
Matlab 并行工具箱:
搜索时使用parfor语句代替for语句,将搜索过程分到2个进程中执行,可以充分利用CPU资源,之前程序运行时CPU占用率为52%左右,使用并行工具箱后,CPU占用率达到100%,理论上来说可以提升效率约2倍,实际执行耗时与之前耗时相比相差不大。
Parfor语句要求每一次循环都是相互独立的,需要特殊的变量定义方式,在将普通for语句转化为parfor语句时,增加和修改了许多变量,这可能是造成效率不高的一个原因,需要改善。 郭涛
今日任务:
提升LOG颜色空间不变性行人识别算法执行效率,使用测试机(4核)执行,新算法耗时仅为原算法的1/5;
使用更多样本测试新算法的图像搜索效果。
效率提升:
所做的优化:
优化for循环,Matlab中将二重循环转化为单重循环;
使用Matlab并行计算工具箱,用parfor代替for,在测试机(4核心)上执行;
下表为搜索一张图片,用四种方法的耗时对比,可见,“for循环优化+并行”执行效率最高,耗时仅为原算法的1/5。
第一次
第二次
第三次
平均
与原始算法对比
原始算法
49.21259
37.42866
32.5097
39.71698
100%
for循环优化
27.6833
17.60857
23.99575
23.09587
58.15%
原始算法+并行
8.4708
10.77365
12.21079
10.48508
26.40%
for循环优化+并行
8.373357
6.494756
7.415887
7.428
18.70%
实验结果:
分别对以下目标进行搜索:
A1、近
A2、遮挡
A3、远
B1、近
B2、较大形
文档评论(0)