基于在线词典学习视觉跟踪算法实现.docVIP

下载本文档

4
0
约5.53千字
约 11页
2018-08-29 发布于福建
举报
版权申诉

基于在线词典学习视觉跟踪算法实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于在线词典学习视觉跟踪算法实现

基于在线词典学习视觉跟踪算法实现　　收稿日期：2014－05－23 　　作者简介：刘师师(1990-),女,湖南郴州人,硕士研究生,主要研究方向:电路与系统; 　　徐学军(1964-),男,湖南益阳人,博士,教授,硕士生导师,主要研究方向:计算机应用技术、医学信息处理、电路与系统等。　　　　　　摘要：针对L1跟踪算法仅考虑了稀疏全局表达的不足，基于在线词典学习的视觉跟踪算法将词典池化的优化方法引入到稀疏表示模型中，充分利用了目标模板的局部结构和空间信息，并采用了一种有效的自适应更新方法，本文根据该算法实现了视觉跟踪处理。通过实验对比IYT、MIL和L1这三种目前较先进的跟踪算法，验证了本跟踪处理器的先进性和有效性。　　关键词：视觉跟踪；稀疏表示；词典池化　　中图分类号：TP393文献标识码：A文章编号：2095-2163（2014）03-0090-03 　　Realization of The Visual Tracking Algorithm based on Online Dictionary to Learn 　　LIU Shishi， XU Xuejun, LI Min 　　(School of Physics And Electronic Science,Changsha University of Science And Technology,Changsha 410114,China) 　　Abstract：For the problem L1 tracking algorithm only considering sparse global express, pooling optimization method in the visual tracking algorithm based on online learning dictionary is introduced into the sparse representation model, which makes full use of local structure and spatial information. After that,using an effective adaptive updating method, this paper realizes the visual tracking processing. By contrast the experiment of IYT, MIL and L1, these three advanced tracking algorithm, the effectiveness of this tracking processor is verified. 　　Key words：Visual Tracking; Sparse Representation; Pooling Dictionary 　　　　0引言　　作为计算机视觉领域的一个重要课题,视觉跟踪更典型的应用主要涉及车辆导航，人机界面和监测研究等方面，而且在其中融合了计算机图像处理、模式识别、人工智能及自动控制等相关领域的诸多知识与关键技术。开展视频目标跟踪的研究旨在模拟人类视觉运动感知功能，提升机器对序列图像中运动目标的辨识能力，由此而为视频分析和理解提供重要的基础实用数据［1-3］。　　1词典学习　　目前，已有许多方法提出了基于词典学习的重构误差最小化的稀疏表示，稀疏表示，也称压缩传感，也是为数众多领域的研究基础，并已在多类视觉应用中获得了成功［4］。鉴于稀疏的限制，一个信号可以表示为只有少数基向量的线性组。此后,根据目标模板的存储和更新,即形成了动态词典。针对如何快速而准确地找到查询点的近邻，现已提出了高维空间索引结构和近似查询的很多种方法，本文采用的KD（k-dimensional）树查找即为其中的一种［5］。　　2模型构建　　针对样品的一组重叠的局部图像块内的目标区域与空间布局，本文采用了目标模板T=［Ti,T2,…,Tn］，其中n为目标模板数。　　2.1词典生成　　初始阶段，从目标模板中选取样本建立模板词典，每5帧图像采用KD树追踪获取nT个范例：在每一帧中选取10个目标，用KD树跟踪这10个目标，存放在范例堆栈中。　　利用KD树查找最佳候选目标并加入目标模板词典后，可将图像分块，每一块的像素均排置到一起，返回的则是每个块所含的像素标签，及每个块所含的像素大小，由此而形成了块索引，由块索引进而生成了块词典。此处假定块尺寸是8，那么在目标模板分块中每步移动的尺寸就是4。也就是说，块与块之间是有重叠的。这些可能候选区域内的局部块将用作词典编码，