- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎图片识别
1
现在图片识别已经是主流搜索引擎必备的技术
这种技术的原理是什么?计算机怎么知道两张图片相似呢?
计算机可以区分颜色吗?
2
将要搜的东西提取出特征值
然后按照特征值比较相似度
按照相似度排序展示
所以总共来说需要解决两个问题,一个是如何取得特征值,一个是如何计算相似度。
相关算法很多,下面主要介绍:
哈希算法
颜色分布法
3
一、平均哈希算法(aHash)
步骤:
1.缩放图片:为了保留结构去掉细节,去除大小、横纵比的差异,把图片统一缩放到8*8,共64个像素的图片。
4
2.转化为灰度图:把缩放后的图片转化为256阶的灰度。
3.计算平均值: 计算进行灰度处理后图片的所有像素点的平均值。
4.比较像素灰度值:遍历灰度图片每一个像素,如果大于平均值记录为1,否则为0.
5
5.得到信息指纹:组合64个bit位,即8*8的矩阵,采样顺序随意只要保持一致性即可。
6.对比指纹:计算两幅图片的指纹,计算汉明距离(即矩阵异或,1的个数就是汉明距离),汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同。(通常认为距离10 就是两张完全不同的图片)
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
1
0
1
0
1
1
1
1
0
1
0
0
1
1
1
0
1
1
1
1
0
1
1
1
0
1
1
0
1
1
1
1
0
1
1
1
0
1
1
1
1
1
1
1
1
0
6
优点:
简单快速不受图片大小缩放的影响
缺点:
是图片的内容不能变更。如果在图片上加几个文字,它就认不出来了。
所以,它的最佳用途是根据缩略图,找出原图。
7
二、感知哈希算法(pHash)
步骤:
1.缩小图片:32 * 32是一个较好的大小,这样方便DCT计算
2.转化为灰度图:把缩放后的图片转化为256阶的灰度图。
3.计算DCT(离散余弦变换):DCT把图片的高频分量与低频分量分离
4.缩小DCT:DCT是32*32,保留左上角的8*8,这些代表的图片的最低频率
8
5.计算平均值:计算缩小DCT后的所有像素点的平均值。
6.进一步减小DCT:大于平均值记录为1,反之记录为0.
7.得到信息指纹:组合64个信息位,顺序随意保持一致性即可。
8.对比指纹:计算两幅图片的指纹,计算汉明距离
9
平均哈希算法过于严格,不够精确,更适合搜索缩略图。
为了获得更精确的结果可以选择感知哈希算法,它采用的是DCT(离散余弦变换)来降低频率的方法
10
三、差异哈希算法(dHash)
步骤:
1.缩小图片:收缩到9*8的大小,一遍它有72的像素点
2.转化为灰度图:把缩放后的图片转化为256阶的灰度图。
3.计算差异值:dHash算法工作在相邻像素之间,这样每行9个像素之间产生了8个不同的差异,一共8行,则产生了64个差异值
4.获得指纹:如果左边的像素比右边的更亮,则记录为1,否则为0.
11
相比pHash,dHash的运算量小,速度快
相比aHash,dHash在效率几乎相同的情况下的效果要更好,它是基于渐变实现的。
12
颜色分布法
每张图片都可以生成颜色分布的直方图。如果两张图片的直方图很接近,就可以认为它们很相似。
任何一种颜色都是由红绿蓝三原色(RGB)构成的,所以上图共有4张直方图(三原色直方图 + 最后合成的直方图)。
13
如果每种原色都可以取256个值,那么整个颜色空间共有1600万种颜色(256的三次方)
需要采用简化方法。可以将0~255分成四个区:
0~63为第0区 64~127为第1区
128~191为第2区 192~255为第3区
这意味着红绿蓝分别有4个区,总共可以构成64种组合(4的3次方)。
任何一种颜色必然属于这64种组合中的一种,这样就可以统计每一种组合包含的像素数量。
14
将表中最后一栏提取出来,组成一个64维向量(7414, 230, 0, 0, 8, ..., 109, 0, 0, 3415, 53929)。这个向量就是这张图片的特征值或者叫指纹。
15
于是,寻找相似图片就变成了找出与其最相似的向量。这可以通过余弦相似度算出
计算两个向量的夹角,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似。
颜色分布法只关注统计意义下的RGB颜色分布信息,而不关系图像本身的空间分布信息
16
谢谢
17
您可能关注的文档
- 信息学奥赛NOIP第4单元循环结构程序设计.ppt
- 第一单元 名著导读《艾青诗选》:如何读诗.ppt
- 凯捷-岗位薪酬绩效.ppt
- 2019-上海二手房交易流程(最详细)-文档资料.ppt
- 高中数学 简单随机抽样课件 新人教A版必修3.ppt
- 优秀员工分享.ppt
- 小学教师资格 证考试 教育教学知识与能力.ppt
- 不等式证明方法与技巧.ppt
- §3-2分布分数δ的计算.ppt
- 国际私法 涉外遗嘱与继承.ppt
- 2025浙江温州市公用事业发展集团有限公司面向高校招聘工作人考前自测高频考点模拟试题最新.docx
- 2025年蓬安县财政局下属单位招聘备考题库附答案.docx
- 广安市农业农村局2025年公开遴选市动物卫生监督所工作人员备考题库附答案.docx
- 南昌市劳动保障事务代理中心招聘3名劳务派遣驾驶员参考题库附答案.docx
- 2025浙江绍兴市新昌县机关事业单位招用编外聘用人员36人备考题库最新.docx
- 浙江国企招聘-2025嘉兴海盐县城市投资集团有限公司招聘7人笔试备考试题附答案.docx
- 长沙银行2026校园招聘备考题库最新.docx
- 2026年度中国地震局事业单位公开招聘备考题库附答案.docx
- 2025福建省晋江圳源环境科技有限责任公司招聘6人模拟试卷附答案.docx
- 浙江国企招聘-2025温州平阳县城发集团下属房开公司招聘5人公笔试备考试题附答案.docx
原创力文档


文档评论(0)