基于Bag of Words模型的多尺度车辆识别方法.docVIP

下载本文档

4
0
约3.03千字
约 5页
2017-03-23 发布于北京
举报
版权申诉

基于Bag of Words模型的多尺度车辆识别方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Bag of Words模型的多尺度车辆识别方法.doc

基于Bag of Words模型的多尺度车辆识别方法　　针对复杂应用场景中，车辆尺度多样而导致的特征个数差异大的问题，本文提出了一种尺度归一化处理结合BOW模型的车辆识别方法。采用归一化处理，通过图像尺寸的放缩，有效缩小了特征个数的差异；采用BOW模型，将特征空间转换到特征频率空间，进一步鲁棒地描述了不同尺度目标的特征。实验结果表明该方法能够有效提升不同尺度车辆目标的整体识别率。　　【关键词】车辆识别归一化 BOW 　　1 引言　　在常规的视频监控（如街道视频监控）中，在长时间监视场景中可能会出现多个大小尺度相差很大的运动目标，给车辆识别应用于实际视频监控系统带来了困难。　　目前机器学习是车辆识别的主流方法，使用机器学习的方法解决多尺度问题时，一般的解决思路是训练出单尺度的分类器，将不同尺度的测试图片均缩放到分类器尺度下进行检测。但是该方法只能在一定尺度变化范围内达到较好的识别效果，当尺度范围变化比较大（如从30*30像素到300*300像素）时，识别效果并不理想。　　本文提出了一种归一化预处理和BOW模型相结合的车辆识别方法，降低了特征差异对分类器的影响，有效解决了尺度范围变化较大的多尺度车辆识别问题。　　2 尺度归一化　　为了减少特征差异，使用对大目标下采样和小目标上采样的方法将尺度归一化，归一化到一个尺度下，对归一化后的图片进行训练，这样提取特征的差异会在一定程度减少。在尺度归一化处理中，下采样选用邻近值的方法，上采样选用双线性插值的方法。双线性插值的核心思想是在两个方向分别进行一次线性插值。该算法中，目标图像中新创造的像素值，是由源图像位置在它附近的2*2区域4个邻近像素的值通过加权平均计算得出的。双线性插值算法放大后的图像质量较高，不会出现像素值不连续的情况。　　数据库选用50*50像素的小目标单姿态数据库、200*200像素的大目标单姿态数据库以及它们大小目标的混合数据库，实验结果表明大小目标的混合数据库的特征点个数在10到1000之间；尺度归一化到100*100像素后，特征点的个数范围变为从169到520，相比于预处理之前，特征点个数的跨度被极大地缩短了。所以尺度归一化处理可以缩短特征点个数的跨度，进而缩小特征差异。　　下面通过大小目标混合库上的实验，说明使用上＼下采样的归一化预处理可以提升识别率。实验选用大小目标的混合数据库，提取SIFT特征，并使用SVM分类器训练。实验结果表明归一化到100*100像素的车辆识别率为85.5%，比未使用归一化处理识别率（79%）提升了6.5%。由此可以看出归一化处理通过减少特征差异，有效提升了车辆识别率。　　为了进一步证明归一化预处理的有效性，我们将样本归一化到了其他的尺度上，并统计该尺度上的车辆识别率。实验结果表明，无论归一化到哪种尺度，其车辆识别率均比未经归一化的识别率高。　　3 基于BOW模型的车辆识别方法　　词包（Bag of Words，BOW）模型是由牛津大学的Sivic等人最先提出，其思想与基于文本的语义分类思想基本一致。将局部特征量化并且标记为视觉词汇，根据训练集中的视觉词汇将局部特征聚类成词典。局部特征集就被映射成了一个关键词频率分布的直方图，即BOW向量。BOW这种描述思想的产生给图像在语义理解领域上的研究提供了新的思路，其在图像分类方面的优异表现使得它很快成为该领域的研究热点。　　BOW 的基本思想是先将图像看成相互独立的图像块集合，再为每个图像块构建一个描述向量。然后将训练集的描述向量进行聚类，生成一个包含视觉词汇的词典。根据视觉词典对图像中的描述向量进行加权统计，生成特征直方图向量，该向量即代表了整幅图像。最后根据训练集图像的向量表示，生成分类器，对图像进行分类。　　在多尺度数据库上，采用本文方法对样本尺度归一化后使用BOW模型，车辆识别率为87.7%；而尺度归一化后未使用BOW模型直接训练SIFT特征的车辆识别率为82.6%，这说明使用BOW模型能够适应多尺度样本，提升识别率。　　4 多尺度车辆识别　　在第3节提出了基于BOW模型的尺度归一化方法，有效提升了车辆识别率，但是实验结果没有突破90%，这与一般的识别方法相比较结果依然不理想。为了进一步的提升识别率，本文提出了归一化到多个尺度的车辆识别方法。归一化到一个尺度上识别率不高的主要原因还是尺度变化范围太大，特征差异大，分类器很难适应特征的差异。为此，借鉴分治的思想，将尺度空间划分为多个区域，每个区域的尺度变化范围就减小了，特征的差异也被缩小了。下面以三个尺度为例简述一下归一化到三个尺度的车辆识别方法。　　将训练集样本缩放到三个集中的尺度，短边像素值在0-75之间的缩放到50，75-150之间的缩放到100，150以上