基于加权特征空间信息视觉词典图像检索模型.docVIP

下载本文档

2
0
约6.52千字
约 13页
2018-07-04 发布于福建
举报
版权申诉

基于加权特征空间信息视觉词典图像检索模型.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于加权特征空间信息视觉词典图像检索模型

基于加权特征空间信息视觉词典图像检索模型　　摘要：针对传统的视觉词袋模型中视觉词典对底层特征量化时容易引入量化误差，以及视觉单词的适用性不足等问题，提出了基于加权特征空间信息视觉词典的图像检索模型。从产生视觉词典的常用聚类算法入手，分析和探讨了聚类算法的特点，考虑聚类过程中特征空间的特征分布统计信息，通过实验对不同的加权方式进行对比，得出效果较好的均值加权方案，据此对视觉单词的重要程度加权，提高视觉词典的描述能力。对比实验表明，在ImageNet图像数据集上，相对于同源视觉词典，非同源视觉词典对视觉空间的划分影响较小，且基于加权特征空间信息视觉词典在大数据集上更加有效。　　关键词：图像搜索；视觉词袋模型；加权特征空间信息；视觉词典；聚类算法　　0 引言　　智能终端设备如智能手机、平板电脑，以及数码相机和数码摄像机的普及和便携化，使这些多媒体采集设备已经成为人们日常生活中不可缺少的一部分。同时智能终端与互联网之间的交互越来越方便，人们大量地使用这些设备来上传、浏览和交流拍摄的数字图像。据Intel统计[1]，仅在Flickr上就有2000万的图像浏览次数。据统计[2]，截至2011年8月，Flickr上的图像总数已达60亿张。相对于文字的信息而言，数字图像具有直观易于理解、信息层次感强、重点突出的特点。面对这无比庞大的图像数据库，人们自然会产生这样的需要：从这海量图像中寻找满足自己要求的图像。因此，人们开发了各种各样的图像检索系统，以满足不同人群的各式各样的需求。　　基于内容的图像检索（Content Based Image Retrieval，CBIR）模型[3-5]的核心思想是模拟人对图像的认知，通过对图像的内容进行计算机层面的分析，根据内容建立语义索引，记录图像深入层面的信息，从而更好地理解用户的需求，呈现更高质量的检索效果。目前有多个在线的基于内容的图像检索系统，比如国外的TinEye[6]，Google Images[7]和百度的百度识图等。　　近年来，国内外对图像检索的研究主要集中在对图像的底层视觉特征以及全局特征的相关反馈的研究。Haas等[8]提出了基于感知学习的相关反馈算法；Wang等[9]提出了带重启的随机游走的图像注释提前算法，从其注释中找到相关视觉特征；针对图像旋转对图像检索造成的影响，朱正礼等[10]提出了预计非下采样轮廓变换、灰度共生矩阵和新相似性度量的旋转不变纹理图像检索算法。受文本领域信息检索的启发，Sivic等[11]将文本信息检索中的词袋模型（Bag of Word，BoW）引入了基于内容的图像检索领域，提出了视觉词袋模型（Bag of Visual Word， BoVW），其核心是将图像局部特征量化到事先聚类的视觉词典上，然后统计一幅图像中出现的视觉单词数量，将图像表示成视觉单词的统计直方图，然后通过倒排索引建立图像集合的数据库表示。尽管BoVW模型是一个较好的用于表示海量图像的方法，但是它仍然有很多不足之处，主要体现在视觉词典的使用上。常用的视觉词典主要具有以下几个缺点：1）在使用视觉词典量化图像的视觉单词时引入了噪声；2）视觉词典中单词的“多义性”没有得到充分挖掘；3）视觉词典这种表示形式本质上丧失了局部特征的空间信息；4）视觉单词和视觉词典的描述能力没有得到充分的挖掘。　　针对上述问题，本文从用于产生视觉词典的常用聚类算法入手，分析和探讨了这些聚类算法的特点，同时考虑聚类过程中利用特征空间中特征分布的统计信息，产生视觉词典的优劣描述，并充分利用聚类算法产生的聚类中心会向特征空间中特征密集的方向移动这一特性，来提高视觉词典的表示能力。该方法与传统的词袋模型和词频逆文档频率（TFIDF）加权方式紧密结合，可以提升视觉词典的可迁移性和图像检索的检索效果　　2 基于加权特征空间信息的视觉词典　　2.1 对特征空间的分析　　特征空间指的是由特征提取（Feature Extraction）步骤得到的特征向量（Feature Vector）生成的向量空间，该概念与线性代数中对应于特征向量（Eigen Vectors）的特征空间不一样。特征空间的每个点均对应一个特征向量，且每个定长的特征向量均对应于等维度的特征空间中的一个点。对特征空间和空间中的关系更简洁与准确的描述，意味着对由特征向量表示的图像数据集更为紧致与精确地表达，也就是说能够提高图像检索系统的图像存储量与检索的效果。因此，如何刻画特征空间，如何用一定的方式来描述在特征空间中匹配的特征向量之间的关系，是非常重要的问题。　　视觉词典本质上是一种对特征空间中向量匹配关系的描述。一般来说，通过特征提取得到的特征向量，利用视觉词典量化为特定的视觉单词。这个过程在特征空间中的表现即为对特征空间中点的聚类。因此，基本的视觉词典