TLD的改进.pptVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TLD的改进

TLD的改进 短期跟踪器:在执行逐帧跟踪时都假设没有完全的遮挡或者目标消失,如光流法 研究工作:集中在提高速度、精度或者开发更可靠的方法来延长跟踪器作用时间但这些研究都不直接设计发生跟踪错误后的处理。 长期跟踪器:要求跟踪器能够运行一个无限长的图像序列,因此跟踪器自身应具备一定的检测能力,这样所跟踪的目标被遮挡或者消失而导致跟踪失败的时候,可以利用检测器重新检测。 长期跟踪器需要考虑的问题: 目标消失后再次出现在视野中 目标外表发生变化,而检测器如果仅由初始目标外表信息训练得到,将导致后续跟踪错误。——自适应问题(逐帧更新和有选择跟新) 逐帧更新法以当前目标的最佳跟踪结果更新目标模型。如果精度不高会加速失败 有选择更新考虑到跟踪结果不总是正确的,因此只在跟踪所得目标与目标模型接近或者新的目标数据能通过半监督学习的方式被融入到目标模型中时才对模型进行更新。 改进1: 在TLD的跟踪器中采用Cell FoT +∑进行设计(原始的TLD跟踪器为:Grid FoT +FB+NCC) 改进2: 在TLD的检测器中引入Kalman滤波器的当前帧目标所在区域预估,缩小了检测器的检测范围,提高了检测器处理速度。 改进3: 在TLD检测器中加入了马尔可夫模型的方向预测器,增强了检测器对相似目标的辨识能力。 在TLD的跟踪器中采用Cell FoT +∑进行设计 TLD中的跟踪器采用了FoT的跟踪方法。FoT是指采用了多个独立的局部跟踪器来各自跟踪目标的一部分区域,然后综合各个局部跟踪器的跟踪效果来估计得到目标的运动。 FoT中,每个局部跟踪器被关联到所要跟踪的目标一部分区域,对该部分区域进行跟踪。 局部跟踪器的条件:所跟踪的区域在所有的图像序列中是可见的并且是简单的位移运动,所以不是鲁棒的。 改进的背景:需要一种机制能将跟踪失败的局部跟踪器剔除,这样可以仅适用能正确跟踪的局部跟踪器来估计目标的运动。 原始的TLD是使用NCC和FB误差来预测跟踪失败的局部跟踪器。 Grid FoT:局部跟踪器以网格状的形式均匀地分布在 所要跟踪的目标区域。 但是这种布置方式不能保证所有的局部跟踪器放置在适合跟踪的位置上,没有得到合适安置的局部跟踪器会因为跟踪错误而漂移离开网格,而Grid FoT在每次估算目标运动后,局部跟踪器需重置到原先在网格上的位置,因此那些之前没有安置在合适位置上的局部跟踪器会继续不能正确跟踪而发生漂移。 Cell FoT:强制每个局部跟踪器在其特定的单元中,这些单元覆盖了整个目标区域,允许局部跟踪器在其对应单元内发生漂移,从而可以在每个单元选择最佳的位置点作为跟踪点 上述改进的基本流程: 采用cell的方式在所要跟踪的目标区域布置一定量的局部跟踪器,局部跟踪器采用光流法跟踪其所在位置的局部图像区域,使用∑预测器判断各个局部跟踪器的跟踪效果,用跟踪成功的局部跟踪器的跟踪效果来估算出目标在图像中的位置和大小。 ∑预测器:领域一致预测器(Nh)、马尔可夫预测器(Mp)、归一化互相关预测期(NCC)组成。 计算速度更快:因为改进后的TLD中使用的∑预测器比原始的预测器少了一次光流运算。 选取每帧图像中目标的中心位置信息来构建Kalman滤波器中的状态变量和观测值: 系统状态量 xk = [px, py, vx, vy]T 观测量 zk=[px, py]T px和py分别代表目标中心在水平方向和竖直方向上的坐标分量 vx和vy分别表示目标在水平方向和竖直方向上的速度。 在实际视频序列中,相邻两帧间的时间间隔很短,可以认为目标在相邻两帧间做匀速运动,系统为线性模型。其状态转移矩阵和观测矩阵分别为 TLD中的检测器是基于窗口扫描的。采用Kalman滤波器的预估效果来缩小TLD的目标检测区域。 改进3:基于马尔可夫模型的目标运动方向预测 以水平方向为例: 定义状态空间为{0为左,1为右}。 马尔可夫模型假设当前预测状态只与上一刻的状态以及状态转移矩阵有关。 定义t时刻的转移矩阵为: 预测t+1时刻的目标运动方向为: 改进2:基于Kalman滤波的目标检测区域预估 式中,h0表示在0~t时刻,视频中目标向左的次数。 h11表示在0~t时间段,视频中目标上一刻和当前时刻都向右运动的次数 h01表示在0~t时间段,视频中目标上一时刻向左运动但当前时刻向右运动的次数。 目标向左(右)运动的判别依据是相邻中的目标中心位置在水平方向上的差值。 直方图(彩色) 超像素(把图像预处理成有意义的组成) condensation算法 Kalman滤波器是基于单个假设的建模。概率分布是单高斯的,不能表示表达多个假设 condensation算法是建立在称为粒子滤波器的一类更广泛的预估器的基础上 Thank you

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档