基于BOW模型相似图像分类检索方法.docVIP

下载本文档

45
0
约4.61千字
约 9页
2018-08-27 发布于福建
举报
版权申诉

基于BOW模型相似图像分类检索方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于BOW模型相似图像分类检索方法

基于BOW模型相似图像分类检索方法　　摘要传统的相似图像检索大多基于颜色、纹理、场景等特征，缺少对图像的局部特征提取，忽视了局部特征对相似图像检索的影响，检索效果较差。本文采用视觉BOW（Bag of words）模型，提取图像中尺度不变的SIFT特征，形成视觉单词向量，设计了一个基于视觉单词的相似图像分类检索方法，取得了较好的分类检索效果。　　【关键词】图像分类检索 BOW模型 SIFT 　　1 引言　　当今，在“互联网+”环境下，图像己经成为网页内容中必不或缺的一部分，在基于关键字从网页中寻找文本信息的同时，需要考虑如何能够快速帮助用户基于图像的内容找到相似的图片。基于内容的图像检索CBIR（Content Based Image Retrieval）是指根据图像本身、图像的内容语义以及上下文联系进行查找，以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。这一概念是于1992年由T.Kato提出的，被广泛应用于各种研究领域，如统计学、模式识别、信号处理和计算机视觉。　　认知心理学派认为，人类大概可以分类三万个不同的类别。计算机视觉要模仿并达到人类对图像的分类处理能力，在处理新类别图像时，必须学习已有知识以加快分类过程。目前，国内外现有的基于内容的图像分类检索系统主要有四种：基于颜色信息的检索、基于图像纹理的检索、基于形状特征的检索和基于空间位置的检索。美国麻省理工学院、荷兰阿姆斯特丹大学等相继开展了图像检索系统相关应用及技术研究，典型代表是Vasconcelos提出的调整权的原则和Rui提出的贝叶斯法则。　　2 视觉BOW模型　　2.1 BOW模型　　BOW模型最早出现在自然语言处理和文本信息检索领域，该模型忽略掉文本的语法、语序等要素，将文档看作若干词汇的集合，文档中的单词是独立出现的，使用一组无序的单词（words）表达一个文档。根据文本中单词的统计信息完成对文本的分类。　　首先给出两个简单的文本文档如下：　　John likes to watch movies. Mary likes too. 　　John also likes to watch football games. 　　根据文档中出现的单词，构建如下一个词典（dictionary）：　　{John： 1， likes： 2，to： 3， watch： 4， movies： 5，also： 6， football： 7， games： 8，Mary： 9， too： 10} 　　上面的词典中包含10个单词，每个单词有唯一的索引（标号），那么每个文本可以使用一个10维的向量来表示。如下：　　[1， 2， 1， 1， 1， 0， 0， 0， 1， 1] 　　[1， 1， 1， 1， 0， 1， 1， 1， 0， 0] 　　该向量的维度是单词的个数，值是每个单词在文本中出现的频率。以上向量也可以用单词的直方图表示，词表相当于直方图的基，要表述的文档向这个基上映射。　　并非所有的单词都用来构建词表，相似的单词用一个单词表示。例如“walk， walking ，walks”都用 “walk”表示。单词对区分文档的重要性通过计算单词TF-IDF（term frequency?Cinverse document frequency，词频-逆向词频）实现。　　BOW模型用于文本分类包括词表的建立、样本训练、新来样本识别三个步骤。　　与文本相似，图像可以视为与位置无关的局部特征的集合，局部特征的地位就类似于文本中的单词，称作“视觉单词”，视觉单词的集合称为“视觉词典”。词袋模型可以类比地应用于图像分类中，文献[3，4，5]中，BOW模型被广泛用到了图像的目标分类。　　2.2 SIFT算法　　尺度不变特征转换（Scale-invariant feature transform或SIFT）是一种特征点提取算法，用来侦测与描述影像中的局部特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量。此算法由David Lowe在1999年所发表，2004年完善总结。　　SIFT算法的实质是在不同的尺度空间上查找关键点（特征点），并计算出关键点的方向。SIFT所查找到的?P键点是一些十分突出，不会因光照，仿射变换和噪音等因素而变化的点，如角点、边缘点、暗区的亮点及亮区的暗点等。　　2.3 视觉BOW模型分类过程　　图像的BOW模型表示即图像中所有图像块的特征向量得到的直方图。具体分类过程如下：　　2.3.1 提取训练样本图像块中的特征向量　　SIFT算法在构建好的尺度空间的基础上搜索尺度空间中的极值点（特征点），然后确定极值点的尺度信息以及位置，再确定极值点的