- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3d haar-like特征
3.3D HAAR-LIKE FEATURES (3D Haar-like 特征)Viola 等人算法的成功在于它在两幅连续的的图像中使用了运动的信息。但是当人移动缓慢的情况下,两幅图像之间的这种运动模式是不明显的,因此从两帧差中提取的特征并不是那么的distinctive。为了在多帧之中捕获长期(long-term)的运动模式,并同时记录人的外貌特征,我们从一系列连续的帧中提取Haar-like特征来代替从连续的两帧中提取特征。虽然我们可以从多帧中获得更多的运动信息,但我们并不能用影像的全部帧来检测一个人。这会花费大量的时间,并且不适用于检测任务。再者,目标可能不会总是停留在整个影像的一个位置。因此,我们将影像划分为小的时空体,该时空体只包含一个影像序列里的若干个帧,并且看起来像一个立体的窗口。这个时空体类似于Viola 等人算法中的2D搜索窗口。一个时空体可以看作是一个独立的整体,可以从中提取各种3D Haar特征。我们的目标是给出一判断标准来判断一个时空体中是否有一个人。接下里将详细描述3D Haar-like特征。3.1 3D haar特征的详细描述这里详细的描述3D Haar特征。在一个时空体中提取3D Haar特征,其可以看作是立体的滤波器。具体地说,我们采用7种类型的一级3D Haar特征。如图1对于每一种立体滤波器,特征值是黑白区域像素强度和(the pixel intensity sum)的绝对差值。在(a)(b)(c)中的立体滤波器表示的是静态特征,类似于2D Haar-like特征。它们只比较了同一区域在时间坐标上的总和。这类特征用来描述行人的外观信息。在(d)(e)(f)(g)中的立体滤波器表示的是动态特征。它们比较了不同区域在时间空间上的总和。以(d)为例,它计算了立体的对角对在时间维度上的差值。由于特征值是在多幅帧之间计算的,它可以更好地描述场景中的运动信息,并捕捉更多的行人运动模式。3.2 积分体( Integral Volume)积分图是一种快速计算2D Haar-like 特征的方法。这形成了一个实时的人脸检测系统和人体检测系统。为了高效的计算3D Haar特征,我们也采用积分图的思想。唯一不同的是我们在三维空间里计算积分图,并且考虑的是积分体。给出坐标系的原点,位置(x,y,t)处积分体的值是指位置坐标小于当前坐标的所有像素的总和。更具体地:其中,是积分值,是原始值。通过积分体,任何立方体的体积(sum)都可以通过其8个坐标值计算出来(7次加/减运算),如图2中的标注所示。由于双箱立体滤波器(图1中的(a)(b)(g))涉及相邻的箱,计算它们需要12个坐标值。图1中的(c)(d)(e)需要18个坐标值来计算。图1中的(f)需要27个坐标值来计算。由于加/减运算的速度很快,因此特征提取的速度也很快。3.3 特征表示(Feature Representation)为了充分地表示时空体,我们使用7种类型的立方滤波器稠密遍历积分体(scan the volume densely)。通常来说,遍历过程立方滤波器的重合体积为1/3或者1/2。给定一个大小为(H,W,T)的时空体,H代表高度,W代表宽度,T代表帧数,定义立体滤波器的大小为(h,w,t),立体滤波器的扫描步长为(hStep,wStep,tStep)。那么一个时空体中的特征个数N为:N个特征值形成时空体的一个N元向量表示。对于检测任务,我们使用高斯核函数SVM作为分类器。在实验评估部分,我们将分析立体窗口参数和帧数是怎样影响检测效果的。4.实验评估在这一部分,首先讨论数据初始化,并概述实验设置。最后给出实验结果。我们在CAVIAR数据集上训练和测试我们的检测器,该数据集包括从一个购物中心的走廊里获取的52个场景。根据我们的目标,我们从原始影像中分割出包含人的区域,并且增加2像素的边缘来保存轮廓信息。然后把分割后的图像重新调整到60*30,并把连续的10幅分割后的图像组成了一个时空体(如图3中描述的那样)。从图3的例子中可以看出,这类时空体有明显的外观特征和一定的运动信息。负样本也以同样的方法获得;唯一不同的是负样本是在不含有行人的影像中随机采样来获得的。用这种方式我们收集了1000个正样本和1000个负样本的时空体。我们进行了三个实验来探讨3D Haar特征的有效性。首先,我们评估可变窗口尺寸的影响。然后,我们分析立体滤波器帧数对检测效果的影响。最后,我们在实际应用中评价3D Haar特征。给定一个大小为(h,w,t)的立体滤波器,我们讨论三个参数是怎样影响检测效果的,并证实我们对3D Haar特征的有效性的假设。首先,我们评估立体滤波器的窗口大小(h,w)的影响。在这部分实验中,我们使用5000个正样本和3000个负样本作为训练集,并
原创力文档


文档评论(0)