基于内容的大规模图像检索技术研究-计算机应用技术专业论文.docxVIP

下载本文档

1
0
约11.03万字
约 130页
2019-04-12 发布于上海
举报
版权申诉

基于内容的大规模图像检索技术研究-计算机应用技术专业论文.docx

1、本文档共130页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

A Dissertation Submitted in Partial Fulfillment of the Requirements for the Degree of Philosophy of Engineering Research on Technology of Content-Based Large-Scale Image Retrieval Ph.D. Candidate ：Benchang Wei Major ：Computer Application Technology Supervisor ：Prof. Junqing Yu A.P. Tao Guan Huazhong University of Science and Technology Wuhan, Hubei 430074, P. R. China May, 2015 独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除文中已经标明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到，本声明的法律结果由本人承担。学位论文作者签名：日期：年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，即：学校有权保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本论文属于保密□，在年解密后适用本授权书。不保密□。（请在以上方框内打“√”）学位论文作者签名：指导教师签名：日期：年月日日期：年月日华华中科技大学博士学位论文 I I 摘要随着互联网和数字成像设备的普及，积聚数字图像的各种网络社区得到了迅速发展，包含大量图像的数据库也随之不断出现，如何从这些海量图像数据库中快速检索出满足用户需求的图像已成为多媒体应用领域中一个重要的主题。为了实现精确而快速的图像检索，解决图像检索中的图像内容精确表示，大规模检索的存储约束以及检索效率等问题，从图像描述符，近似最近邻检索以及高维向量索引等几个方面进行了深入的研究。针对全局描述符 VLAD 的区分度与存储大小之间的矛盾，提出了一种增强的图像描述符，其通过两层视觉码书来生成图像的 VLAD 描述符，即图像的局部特征的残差向量基于细粒度的第二层视觉子码书而产生，而残差向量的累积基于粗粒度的第一层视觉子码书。另外，针对图像局部特征非均匀分布，对第二层视觉子码书提出了优化措施。实验结果表明，两层码书及优化策略能显著提高固定大小的 VLAD 描述符的区分度。针对在向量原始空间训练量化器及向量量化编码时间开销过大的缺陷，设计了残差投影量化器，并将其用于近似最近邻检索。残差投影量化器由多阶段子量化器组成，在每一个阶段子量化器训练过程中，借助主成分分析将高维向量投影到低维空间，并通过 K 均值聚类算法在低维空间生成子量化器的视觉码书，量化产生的残差则反投影到原始空间用于训练下一阶段子量化器。另外，以训练阶段和量化阶段的总体误差最小化为目标，提出了相应阶段的优化措施。查询时，所采用的非对称距离计算及查找表很好的满足了大规模高维向量检索的精度和效率需求。为了提高检索效率，提出了基于二级邻接图的索引结构。第一级邻接图反映的是转换积量化器视觉码书和数据库向量的近邻关系，用于快速生成查询的近邻种子，在第一级邻接图的生成过程中，采用逆向生成模式，即先将数据库向量分配给转换积量化器的多个最近邻视觉码字，然后，再为每个视觉码字保留少数几个最近邻数 II II 据库向量。第二级邻接图反映的是数据库向量到自身的近邻关系，用于近邻传递，为了快速生成第二级邻接图，采用了一种基于划分树的邻接图近似构建算法。基于二级邻接图进行查询时，对于给定的查询向量，先快速检索到该查询向量在转换积量化器视觉码书中的最近邻视觉码字，并基于第一级邻接图的邻接关系快速生成查询向量的最近邻种子，对每一个最近邻种子，基于第二级邻接图的邻接关系实现近邻传递，重复上述过程直到检索到的最近邻个数满足指定的阈值为止。基于二级邻接图的不完全检索很好的解决了大规模检索的实时需求。基于内容的大规模图像检索需要研究的问题还有很多。在图像描述符方面，如何融合多种视觉特征用于生成图像描述符以更好的表达图像内容是需要进一步研究的问题。在快速最近邻检索方面，基于哈希的方法虽然速度较快但普遍精度较低，如何利用语义信息提高基于哈