图象检索中的相关反馈机制.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容的图像检索的早期工作 找到所谓的“最佳”特征或特征组合; 基于“最佳”特征或特征组合提高图像检索精确度 ; 早期检索系统本身还有如下工作可以深入 特征提取; 相似度度量函数; 检索响应时间提高; 根据加州大学伯克利分校Peter Lyman和Hal Varian最近的报告,全球每年产生的信息量约1到2EB字节(exabyte,100亿亿),这些信息的绝大多数以图像、声音和数据的形态存在,印刷文档只占总量的0.003%。越来越多新出现的信息以数字形式创建、存储、检索,超过90%的信息采用数字方式存储。 假设按照旧有方法计算相似度 对一年产生的图象信息检索,查询一张图片,按照目前G级CPU计算速度,29天后返回结果。 总之,传统检索系统称为以计算机为中心的图像检索系统。尽管这种方法奠定了CBIR(Content-Based Image Retrieval)的基础,但是它的检索性能并不令人满意 基于查询向量的相关反馈 来源于文本检索; 三个模型的解释 文档模型(一般是提取关键字,组成向量); 检索模型(基于关键字进行检索,图象是基于图象例子的); 相似度匹配模型(计算关键字或特征之间的欧拉距离) 与相关反馈密切的技术 文本关键字权重计算 文本检索相关反馈模型 文本关键字权重计算 在文本检索模型中,每个文档都是由关键字的集合来表示的,而每个关键字的权重是根据关键字对文档的相对重要程度来确定的; 假设tk (k=1,…,N) 代表字典里的关键字(N为字典中关键字的数量),而ωik为文档Di中关键字tk的权重。 具体实现手段 假设在所有被检索文档中,已经知道与查询相关的文档集合DR,以及与查询不相关的文档集合DN,则可以通过以下的公式来计算最优的查询向量Qopt 如下定义两个人之间的相似度 年纪+毛细孔数目+体重+身高,以这些性质的总和来比较两个人之间的相似性; 25+1000000000+100+171=毛细孔数目 值域的不同使得某些分量完全可以不需要了; 统计学中,一般要对所有分量做归一化处理 如何计算分量重要性因子 为了估计ci因子,就必须注意到ci和分量值fik具有非常相近的含义,前者表现的是某个分量在向量中的相对重要性,后者则表现了某种特征在图像中出现的显著程度大小 为了消除分量之间因值域不同所带来的不可比较性,采用如下归一化方法来从fik值计算ci: 图象特征的权重表示 基于特征权重改变的相关反馈 向量优化方法是根据用户反馈来优化查询向量Q,而不是调整特征权重。事实上,图像特征所有分量的权重在检索开始前就已经计算好了,在相关反馈的过程中并不随之改变 调整特征权重为途径的相关反馈方法则则通过动态地调整图像特征的权重来达到改进检索结果的目的 特征权重相关反馈结构 D是原始图像数据,例如JPEG格式的图像 F={fi}是此图像底层特征的集合,这些特征包括颜色、纹理和形状特征等 R={rij}是某种给定特征fi的表达形式,如颜色直方图和颜色矩都是颜色特征的表达方式。每一种特征表达rij本身可能就是由许多分量组成的向量,可以写成如下形式: 模型优点 该模型允许采用多个特征(及特征表达)对图像进行描述,每个特征都有动态权值与之对应 图像特征权值存在于上述模型的每一级上,Wi、Wij和Wijk分别对应于图像特征fi、特征表达rij和特征表达的每一分量rijk。 相关反馈就是找到最能体现用户信息需要的每个特征恰当权值 以前章节中所说的图像特征等价于上述图像模型中的特征表达形式rij,模型中的图像特征fi指的是抽象概念上的图像特征,而并非具体的数学表达形式。 相关反馈涉及的因素 一个图像模型和一组相似度算法M={mij}一起构成了CBIR模型 相似度算法M是用来计算两个图像对象之间的相似度。不同的特征可能采用不同的相似度算法,例如欧拉距离适用于纹理向量特征,而直方图相交适用于颜色直方图。 Mij表示对图象i的第j类特征所赋予的相似度函数 反馈与非反馈的区别 在反馈中,可以认为存储在数据库中的图像对象都是客观的,它们的各级特征权重都是固定的。对于查询Q,在以计算机为中心(非交互式)的方法中,也被认为是客观的,即其所有权值也是固定的。由于固定了权值,该方法往往不能有效反映出图像的高层语义和用户的查询要求。此外,该方法还要求用户在查询中指定一组精确的权值,这对于一般用户来说是难以做到的。 与此相反,采用相关反馈的交互式检索方法将查询看成是主观的。在检索过程中,它根据用户的反馈信息动态调整特征权重,因此更准确地体现了用户的信息需求,还解除了要求用户指定权重的负担。 相关反馈中的两个重要步骤 归一化(使每类特征的值域相同,存在可比性) 权值调整(使每个特征的重要性不同,体现主观性) 为什么要归一化 图象相

您可能关注的文档

文档评论(0)

0004499 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档