面向鲁棒跟踪的视觉特征自适应选择与融合方法研究教案.docxVIP

下载本文档

1
0
约1.08万字
约 8页
2017-09-09 发布于湖北
举报
版权申诉

面向鲁棒跟踪的视觉特征自适应选择与融合方法研究教案.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

面向鲁棒跟踪的视觉特征自适应选择与融合方法研究视频图像中的运动目标跟踪作为计算机视觉研究当中的一个基础性跨学科问题，融合了图像处理、模式识别、机器学习等多个不同领域的理论和知识。近些年来随着高性能计算机的发展、日益增长的自动视频分析需求，运动目标跟踪已经成为计算机视觉领域的一个热点研究问题。在视觉导航[1]，视频压缩编码[2]，智能监控[3]，智能交通[4]，人机交互[5]，医学[6]，军事[7]等领域有着广阔的应用前景.在运动目标备受研究者们的关注的同时，也有很多因素使得鲁棒精确实时地定位运动目标存在一定程度的困难。这些因素主要包括：背景干扰，摄像机抖动，障碍物遮挡，光照变化，目标自身姿态的变化等等。在这些复杂条件下，仅使用单一的特征来描述目标表达能力不够，因此，有很多研究者从众多的特征描述子中挑选出最具表达能力的k个特征，然后将其有效地融合，从而提高复杂场景下多特征的描述能力。1. 常见的特征描述子1.1颜色特征颜色特征[8]是在图像检索中应用最为广泛的视觉特征，主要原因在于颜色往往和图像中所包含的物体或场景十分相关。此外，与其他的视觉特征相比，颜色特征对图像本身的尺寸、方向、视角的依赖性较小，从而具有较高的鲁棒性。颜色直方图是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例，而并不关心每种色彩所处的空间位置，即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。当然，颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间，原因在于大部分的数字图像都是用这种颜色空间表达的。然而，RGB空间结构并不符合人们对颜色相似性的主观判断。因此，有人提出了基于HSV空间、Luv 空间和Lab空间的颜色直方图，因为它们更接近于人们对颜色的主观认识。其中HSV空间是直方图最常用的颜色空间。它的三个分量分别代表色彩（Hue）、饱和度（Saturation ）和值（Value）。计算颜色直方图需要将颜色空间划分成若干个小的颜色区间，每个小区间成为直方图的一个bin 。这个过程称为颜色量化（color quantization ）。然后，通过计算颜色落在每个小区间内的像素数量可以得到颜色直方图。颜色量化有许多方法，例如向量量化、聚类方法或者神经网络方法。最为常用的做法是将颜色空间的各个分量（维度）均匀地进行划分。相比之下，聚类算法则会考虑到图像颜色特征在整个空间中的分布情况，从而避免出现某些bin 中的像素数量非常稀疏的情况，使量化更为有效。另外，如果图像是RGB格式而直方图是HSV空间中的，我们可以预先建立从量化的RGB空间到量化的HSV空间之间的查找表（look-up table），从而加快直方图的计算过程。颜色特征作为一个最具代表性的全局特征，计算简单，在很多条件下用颜色特征来描述目标都能取得比较鲁棒的结果。但是，在一些复杂条件下，如光照变化，背景干扰等情况下缺乏鲁棒性。1.2 HOG特征HOG即histogram of oriented gradient, 是用于目标检测的特征描述子，该技术将图像局部出现的方向梯度次数进行计数，该方法和边缘方向直方图、scale-invariant feature transform类似，不同的是hog的计算基于一致空间的密度矩阵来提高准确率。Dalal[9]首先在05年的CVPR中提出HOG，用于静态图像or视频的行人检测。HOG的核心思想是所检测的局部物体外形能够被光强梯度或边缘方向的分布所描述。通过将整幅图像分割成小的连接区域（称为cells），每个cell生成一个方向梯度直方图或者cell中pixel的边缘方向，这些直方图的组合可表示出（所检测目标的目标）描述子。为改善准确率，局部直方图可以通过计算图像中一个较大区域(称为block)的光强作为measure被对比标准化，然后用这个值(measure)归一化这个block中的所有cells.这个归一化过程完成了更好的照射/阴影不变性。与其他描述子相比，HOG得到的描述子保持了几何和光学转化不变性（除非物体方向改变）。因此HOG描述子尤其适合人的检测。1.3纹理特征图像纹理是一种重要的视觉手段，是图像中普遍存在而又难以描述的特征。纹理特征提取的目标是：提取的纹理特征维数不大、鉴别能力强、稳健性好，提取过程计算量小，能够指导实际运用。纹理的定义一直为人们所关注，但是图像纹理定义问题至今没有得到圆满的解决，仍然不存在为众人所公认的定义。其中的共识是一：纹理不同于灰度和颜色等图像特征，它通过像素及其周围空间邻域的灰度分布来表现，即局部纹理信息；二：局部纹理信息不同程度的重复性，即全局纹理信息。Ojala[10]等提出了一种非常有效的纹理特征描述子，称为LBP。LBP描述子