- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于基元结构的图像检索以及相关反馈.doc
基于基元结构的图像检索以及相关反馈
摘 要:在本文中,我们提出了一种新颖的特征描述符用于图像检索,即基元结构直方图。它使用了颜色和边缘方向信息来描述图像的基元结构信息。在特征提取时,我们使用更符合人眼的视觉认知机制的HSV颜色空间。在相关反馈阶段,我们对权重进行不断的更新,以达到更好的检索效果。
关键词:特征提取;基元结构直方图;相关反馈
中图分类号:TP391.3
1 基元结构直方图
1.1 HSV颜色空间及量化
相对RGB颜色空间,HSV颜色空间更加符合人眼的视觉认知机制。H指色相,即色彩的基本属性;S是饱和度,即色彩的纯度;V是明度,即明亮程度。为了提取颜色信息并且简化操作,我们将大小为M×N的图像的H,S,V三个通道分别均匀的量化成3个级别,共获得27种颜色级别。设C(x,y)为量化后的图像,其中x=[0,1,…,M-1],y=[0,1,…,N-1],C(x,y)的取值范围为[0,1,…,26]。
1.2 边缘方向的提取和量化
我们使用Sobel算子计算一幅全彩色图像的红,绿,蓝三个通道的梯度值。设a=(Hx,Sx,Vx),b=(Hy,Sy,Vy),其中Hx,Sx,Vx分别表示H,S,V三个通道沿着水平方向的梯度,Hy,Sy,Vy表示垂直方向的梯度。
a,b之间的角度为:
(1)
当一幅图像每个像素点的纹理方向都计算出来之后,我们将其均匀的量化成18个级别,每个级别的角度间隔为10°。
1.3 基元结构图
在图像的一个2×2的方格,如果有两个像素点的值相同,则认为这些像素点形成一种基元,构建基元图时,使用的是量化后的颜色索引图,将2×2方格在图像上以2为步长遍历,判断是否有基元出现在方格中,如果方格中的数值符合其中的一个基元模型,方格中的四个数值全部保留;若不符合任何一个模型,则方格中的所有数值都置为0。
1.4 特征表示
本文充分融合了共生矩阵和直方图的优点,提出一种新的直方图[4],基元结构直方图。假设基元图像T(x,y)的值T(p)=w,w∈{0,1,…,W-1},像素点的位置为p=(x,y),如果p1=(x1,y1),p2=(x2,y2),T(p1)=w1,T(p2)=w2。在边缘方向索引图像θ(x,y)中,θ(p)=v,v∈{0,1,…,V-1},θ(p1)=v1,θ(p2)=v2。设在2×2的方块中,w1和w2共同出现的次数为F1,v1和v2共同出现的次数为F2,基元结构直方图定义为:
Hcolor(T(x,y))=F1{θ(p1)=v1Λθ(p2)=v2} 当θ(p1)=θ(p2)=v1=v2时 (2)
Hori(θ(x,y))=F2{T(p1)=w1ΛT(p2)=w2} 当T(p1)=T(p2)=w1=w2时 (3)
2 相关反馈
数据库中的图像I和待检索图像Q之间的相似性度量由加权的闵可夫距离给出:
(4)
其中,fiI,fiQ是I和Q的第i个特征分量,wi是权重因子。相关反馈时,我们使用反馈回来的样本对权重进行更新。权值如下:
(5)
其中,σkNr,i是第k次迭代返回的Nr个检索出来的图像的标准差,σkrel,i是第k次迭代返回的相关图像的标准差。文献[1][2]中,如果一个特征分量经过相关样本产生很小的变化,那么它将得到相对较高的权重因子。文献[3]使用一个判别比来决定特征分量从不相关的图像中区分相关图像的能力:
(6)
分子指第i个特征分量在第k轮迭代负样本落在了正样本取值区间内的个数,分母指第i个特征分量在第k轮中负样本的个数。当没有一个负样本落在正样本取值区间范围内时,最大的权重将赋给这一特征分量。
(7)
Weight-type3结合了判别比和公式(7)的权重因子。达到了从不相关的样本中分离出相关图像的效果。如公式(8)
(8)
3 实验结果
本文使用的是两个Corel数据集:Corel_1000数据集,十类图像,每类100张,共1000张图像;Corel_5000数据集,50类共5000张图像。
图1 三轮相关反馈的检索结果
实验部分,图1为Corel_5000数据集中的一幅图像经过3轮反馈的检索效果,图1(a)为一幅图像使用基元结构直方图进行检索的结果,其精准率为66.67%;图1(b)表示的是三次反馈的检索结果,精准率为100%。
如表1所示,在Corel_1000数据集中,经过三轮的相关反馈,平均精准率提高了12.89%,在Corel_5000数据集中平均精准率提高了14.90%。
表1 Corel数据集经过三轮反馈的平均精准率和召回率
数据集 性能指标 第一次检索
您可能关注的文档
最近下载
- 成都市金牛区2020-2021学年下学期一年级期末考试语文试卷(部编版).pdf VIP
- 儿科“一科一品”之做有温度的护理人.pptx VIP
- 2025年广州数学中考试题及答案.doc VIP
- 中文释义 PASS图解速记高中词汇正序版.xlsx VIP
- 辅警招聘考试公安基础知识(情景分析题)模拟试卷3(题后含答案及解析).pdf VIP
- 工程质量风险分级管控清单 .pdf VIP
- 生物医学工程先进制造:第一章 绪论-2015.ppt VIP
- 培养员工归属感培养员工归属感.ppt VIP
- 古方上篇后八方.张志峰老师讲解和答疑2016.3.5.doc VIP
- JingChaDaXue《灭火救援指挥》期末试卷(A)参考答案.docx VIP
文档评论(0)