传统图片检索技术发展.PDF

下载文档

2
0
约1.1万字
约 10页
2019-01-25 发布于湖北
举报
版权申诉
保障服务

传统图片检索技术发展.PDF

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

本文由SIGAI 人工智能平台原创，未经允许，不得转载传统的图片检索技术的发展 SIGAI 特邀作者：满意 2018．7.27 今天我们来介绍一下图片检索技术，图片检索就是拿一张待识别图片，去从海量的图片库中找到和待识别图片最相近的图片。这种操作在以前依靠图片名搜图的时代是难以想象的，直到出现了 CBIR(Content-based image retrieval)技术，依靠图片的内容去搜图。比较常见的图搜平台有百度、谷歌、拍立淘等，有些图搜技术已经能达到非常不错的效果。接下来我们做个测试，给出一个柯基宝宝的图片，分别用三家搜索引擎进行搜索：图1 原图本文由SIGAI 人工智能平台原创，未经允许，不得转载图2 百度搜索结果本文由SIGAI 人工智能平台原创，未经允许，不得转载图3 谷歌搜索结果图4 拍立淘搜索结果早期的图片检索技术都是基于文本的，需要按照图片的名称去搜索对应的图片，而这样有个很明显的缺陷就是：大量的图片需要人为事先去命名，这个工作量太大了。随后渐渐出现了基于内容的图片检索技术，较早出现的有哈希算法 LSH(Locality-Sensitive Hashing)，随后图搜这一块逐渐丰富，从BOF - SPM - ScSPm -LLC 使传统的图搜技术逐渐成熟。下面我们就来巴拉一下传统图搜技术的前世今生。一、LSH(Locality-Sensitive Hashing) LSH 较为官方的理解为：将原始数据空间中的两个相邻数据点通过相同的映射后，这两个数据点在新的数据空间中仍然相邻的概率很大，而不相邻的数据点被映射到同一个桶的概率很小。也就是说，如果我们对原始数据进行一些 hash 映射后，我们希望原先相邻的两个数据能够被 hash 到相同的桶内，具有相同的桶号。因此，LSH 算法使用的关键是针对某一种相似度计算方法，找到一个具有以上描述特性的 hash 函数，使得经过它们的哈希映射变换后，原始空间中相邻的数据落入相同的桶内，那么我们在该数据集合中进行近邻查找就变本文由SIGAI 人工智能平台原创，未经允许，不得转载得容易，只需要将查询数据进行哈希映射得到其桶号，然后取出该桶号对应桶内的所有数据，再进行线性匹配即可查找到与查询数据相邻的数据。上面的叙述太过理论化，那么 hash 算法具体怎么应用到图搜技术中呢？参照 nash_同学我们列举了三种不同的hash 算法： (一)、平均哈希算法(aHash) 此算法是基于比较灰度图每个像素与平均值来实现的，最适用于缩略图搜索。步骤： 1.缩放图片：为了保留结构去掉细节，去除大小、横纵比的差异，把图片统一缩放到8*8，共64 个像素。 2.转化为灰度图：把缩放后的图片转化为256 阶的灰度图 3.计算平均值：计算进行灰度处理后图片的所有像素点的平均值 4. 比较像素灰度值：遍历64 个像素，如果大于平均值记录为1，否则为0. 5.得到信息指纹：组合64 个bit 位，顺序随意保持一致性即可。 6.对比指纹：计算两幅图片的汉明距离，汉明距离越大则说明图片越不一致，反之，汉明距离越小则说明图片越相似，当距离为0 时，说明完全相同。(通常认为距离10 就是两张完全不同的图片) (二)、感知哈希算法(pHash) 平均哈希算法过于严格，不够精确，更适合搜索缩略图，为了获得更精确的结果可以选择感知哈希算法，它采用的是DCT(离散余弦变换)来降低