基于内容的大规模图像检索基本方法.pdfVIP

基于内容的大规模图像检索基本方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内窨硇大规模图像楦索基本方法 中国华为技术有限公司 徐 磊 [摘 要]基于内容的图像检索方法是利用互联网上大量的图像信息,以计算机视觉、信息检索、统计学习等理论为基础,发展图像 内 容的提取和检索技术。本文主要针对提取的显著点和特征缺乏语义信息的问题,提出将显著点和SVM相关反馈结合的图像检索方法。 [关键词]图像检索 特征提取 显著点 相关反馈 1.引言 书。聚类算法是将向量集合分组为若干子集。算法的目标是创建聚类 基于内容的图像检索(content—basedimageretrieval,简称CBIR)与 使得聚类内部的向量具有某种相似性而聚类之间的向量具有某种区 基于文本的图像检索(text—basedimageretrieval,简称TBIR)完全不同, 别。也就是说,在一个聚类中的向量应该尽可能的相似,而不处在一个 不需要人工的介入。CBIR利用图像 自身的视觉特征,如图像的颜色 、 聚类中的向量应该尽可能的不同。 纹理 、布局等,这些特征通过图像处理与计算机视觉算法 自动检测和提 取,具有较高的处理速度以及较强的客观性,然后利用这些特征来索引 图像库中的每一张图像。检索的时候用户通常是提供一个图像样例而 不是提供关键字 ,系统从样例图像中自动提取同样的视觉特征 ,然后与 数据库中所有的特征比对,并将与样例图像特征相似的图像作为结果 返回给用户 “。 早期的研究工作主要关注如何有效地从图像中提取特征。然而, 经过近十年的研究发现,要定义出一种非常有效的视觉特征来描述图 像中表示的物体 、场景、概念是非常困难的 ,即图像中的低层信息特征 (如纹理 、线条 、颜色等)无法有效的对图像高层语义进行描述。一个解 决方法是在更小的粒度上进行图像检索,该方法称为基于区域的图像 图1SIFT描述符提取方法 检索 (region—basedimageretrieval,简称RBIR)。RBIR仍然处于CBIR的 K均值算法迭代运行分为两个步骤: 框架之中。它首先通过图像分割技术将一幅图像分为若干个子区域 1)将向量复制给与其距离最近的聚类重心所在的聚类; (例如图像中的每个单独的物体所 占据的像素联通区域标识为一个区 2)每个聚类根据重新设置的向量计算新的聚类重心。 域),使得其中每个子区域具有独特的语义,利用这些语义信息的集合 2.2基于全局描述符的图像检索方法 来对图像建立索引。查询图像经过相同的处理方式得到类似的一组语 全局描述符的优点是可以以紧凑的描述符向量表示图像,每幅图 义信息,然后系统通过比较这些语义信息集合的相似度来确定图像之 像对应高维特征空间中的一个点,从而可以使用很多经典的算法对图 间的相似度。 像匹配问题进行处理,如高维空间中的最近邻检索可以用来完成图像 与通常的图像检索问题相 比,图像检索的大规模主要是两个方面: 和图像之间的匹配检索。 数据的大规模化和检索的实时性 ,随之带来两个问题: 2.2.1高维向量近似最近邻搜索 1)如何高效地从大规模图像中提取特征信息; 当图像通过全局描述符表示为高维空间中的一个点时,图像检索 2)如何构建一个满足海量数据实时检索的索引结构。 问题就转换为高维向量的最近邻 (nearestneighbor,简称NN)搜索问题: 大规模图像检索问题的主要工作: 数据库中的所有图像对应于高维空间中的一组点,当查询图像提交时, 1)从海量数据中提取特征信息。TBIR、CBIR和RBIR分别从不同 查找与该图像对应点最近的一个或者若干个点。 的角度理解图像并从中提取信息。TBIR由于其准确性和需要人工介 2.2.2高维向量线性降维 入并不适合从大规模图像中提取信息,而RBIR由于需要对图像做分 如果高维向量的结构比较稀疏,并且有着比较明显的结构性,一般 割,受 目前图像分割技术的限制也无法应用于大规模图像的特征信息 使用降维技术将向量从

您可能关注的文档

文档评论(0)

人生新旅程 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档