基于内容的大规模图像检索技术研究-计算机应用技术专业论文.docxVIP

基于内容的大规模图像检索技术研究-计算机应用技术专业论文.docx

  1. 1、本文档共130页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
A Dissertation Submitted in Partial Fulfillment of the Requirements for the Degree of Philosophy of Engineering Research on Technology of Content-Based Large-Scale Image Retrieval Ph.D. Candidate :Benchang Wei Major :Computer Application Technology Supervisor :Prof. Junqing Yu A.P. Tao Guan Huazhong University of Science and Technology Wuhan, Hubei 430074, P. R. China May, 2015 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本人完全意识到,本声明的法律结果由本人承担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本论文属于 保密□,在 年解密后适用本授权书。 不保密□。 (请在以上方框内打“√”) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 华 华 中 科 技 大 学 博 士 学 位 论 文 I I 摘 要 随着互联网和数字成像设备的普及,积聚数字图像的各种网络社区得到了迅速 发展,包含大量图像的数据库也随之不断出现,如何从这些海量图像数据库中快速 检索出满足用户需求的图像已成为多媒体应用领域中一个重要的主题。为了实现精 确而快速的图像检索,解决图像检索中的图像内容精确表示,大规模检索的存储约 束以及检索效率等问题,从图像描述符,近似最近邻检索以及高维向量索引等几个 方面进行了深入的研究。 针对全局描述符 VLAD 的区分度与存储大小之间的矛盾,提出了一种增强的图 像描述符,其通过两层视觉码书来生成图像的 VLAD 描述符,即图像的局部特征的 残差向量基于细粒度的第二层视觉子码书而产生,而残差向量的累积基于粗粒度的 第一层视觉子码书。另外,针对图像局部特征非均匀分布,对第二层视觉子码书提 出了优化措施。实验结果表明,两层码书及优化策略能显著提高固定大小的 VLAD 描述符的区分度。 针对在向量原始空间训练量化器及向量量化编码时间开销过大的缺陷,设计了 残差投影量化器,并将其用于近似最近邻检索。残差投影量化器由多阶段子量化器 组成,在每一个阶段子量化器训练过程中,借助主成分分析将高维向量投影到低维 空间,并通过 K 均值聚类算法在低维空间生成子量化器的视觉码书,量化产生的残 差则反投影到原始空间用于训练下一阶段子量化器。另外,以训练阶段和量化阶段 的总体误差最小化为目标,提出了相应阶段的优化措施。查询时,所采用的非对称 距离计算及查找表很好的满足了大规模高维向量检索的精度和效率需求。 为了提高检索效率,提出了基于二级邻接图的索引结构。第一级邻接图反映的 是转换积量化器视觉码书和数据库向量的近邻关系,用于快速生成查询的近邻种子, 在第一级邻接图的生成过程中,采用逆向生成模式,即先将数据库向量分配给转换 积量化器的多个最近邻视觉码字,然后,再为每个视觉码字保留少数几个最近邻数 II II 据库向量。第二级邻接图反映的是数据库向量到自身的近邻关系,用于近邻传递, 为了快速生成第二级邻接图,采用了一种基于划分树的邻接图近似构建算法。基于 二级邻接图进行查询时,对于给定的查询向量,先快速检索到该查询向量在转换积 量化器视觉码书中的最近邻视觉码字,并基于第一级邻接图的邻接关系快速生成查 询向量的最近邻种子,对每一个最近邻种子,基于第二级邻接图的邻接关系实现近 邻传递,重复上述过程直到检索到的最近邻个数满足指定的阈值为止。基于二级邻 接图的不完全检索很好的解决了大规模检索的实时需求。 基于内容的大规模图像检索需要研究的问题还有很多。在图像描述符方面,如 何融合多种视觉特征用于生成图像描述符以更好的表达图像内容是需要进一步研究 的问题。在快速最近邻检索方面,基于哈希的方法虽然速度较快但普遍精度较低, 如何利用语义信息提高基于哈

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档