网站大量收购独家精品文档,联系QQ:2885784924

传统图片检索技术发展.PDF

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本文由SIGAI 人工智能平台原创,未经允许,不得转载 传统的图片检索技术的发展 SIGAI 特邀作者:满意 2018.7.27 今天我们来介绍一下图片检索技术,图片检索就是拿一张待识别图片,去从海量的图片 库中找到和待识别图片最相近的图片。这种操作在以前依靠图片名搜图的时代是难以想象 的,直到出现了 CBIR(Content-based image retrieval)技术,依靠图片的内容去搜图。比较常见 的图搜平台有百度、谷歌、拍立淘等,有些图搜技术已经能达到非常不错的效果。接下来我 们做个测试,给出一个柯基宝宝的图片,分别用三家搜索引擎进行搜索: 图1 原图 本文由SIGAI 人工智能平台原创,未经允许,不得转载 图2 百度搜索结果 本文由SIGAI 人工智能平台原创,未经允许,不得转载 图3 谷歌搜索结果 图4 拍立淘搜索结果 早期的图片检索技术都是基于文本的,需要按照图片的名称去搜索对应的图片,而这样 有个很明显的缺陷就是:大量的图片需要人为事先去命名,这个工作量太大了。随后渐渐出 现了基于内容的图片检索技术,较早出现的有哈希算法 LSH(Locality-Sensitive Hashing),随 后图搜这一块逐渐丰富,从BOF - SPM - ScSPm -LLC 使传统的图搜技术逐渐成熟。下面我 们就来巴拉一下传统图搜技术的前世今生。 一、LSH(Locality-Sensitive Hashing) LSH 较为官方的理解为:将原始数据空间中的两个相邻数据点通过相同的映射后,这两 个数据点在新的数据空间中仍然相邻的概率很大,而不相邻的数据点被映射到同一个桶的概 率很小。也就是说,如果我们对原始数据进行一些 hash 映射后,我们希望原先相邻的两个 数据能够被 hash 到相同的桶内,具有相同的桶号。因此,LSH 算法使用的关键是针对某一 种相似度计算方法,找到一个具有以上描述特性的 hash 函数,使得经过它们的哈希映射变 换后,原始空间中相邻的数据落入相同的桶内,那么我们在该数据集合中进行近邻查找就变 本文由SIGAI 人工智能平台原创,未经允许,不得转载 得容易,只需要将查询数据进行哈希映射得到其桶号,然后取出该桶号对应桶内的所有数据, 再进行线性匹配即可查找到与查询数据相邻的数据。 上面的叙述太过理论化,那么 hash 算法具体怎么应用到图搜技术中呢?参照 nash_同 学我们列举了三种不同的hash 算法: (一)、平均哈希算法(aHash) 此算法是基于比较灰度图每个像素与平均值来实现的,最适用于缩略图搜索。 步骤: 1.缩放图片:为了保留结构去掉细节,去除大小、横纵比的差异,把图片统一缩放到8*8, 共64 个像素。 2.转化为灰度图:把缩放后的图片转化为256 阶的灰度图 3.计算平均值: 计算进行灰度处理后图片的所有像素点的平均值 4. 比较像素灰度值:遍历64 个像素,如果大于平均值记录为1,否则为0. 5.得到信息指纹:组合64 个bit 位,顺序随意保持一致性即可。 6.对比指纹:计算两幅图片的汉明距离,汉明距离越大则说明图片越不一致,反之,汉 明距离越小则说明图片越相似,当距离为0 时,说明完全相同。(通常认为距离10 就是两 张完全不同的图片) (二)、感知哈希算法(pHash) 平均哈希算法过于严格,不够精确,更适合搜索缩略图,为了获得更精确的结果可以选 择感知哈希算法,它采用的是DCT(离散余弦变换)来降低

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档