- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图像检索技术综述.ppt
图像检索技术综述 本文主要内容 图像检索技术的发展历史 当前主流的图像检索技术介绍 一个图像搜索引擎的系统模型 20世纪70年代: TBIR (Text-based Image Retrieval) 基于文本的图像检索技术 沿用了传统文本检索技术,利用文本描述的方式表示图像的特征。 早期的TBIR: 手工对图像进行注释,工作量相当大,不可避免地会带来主观性和不精确性 Internet环境下的TBIR: 网页信息的自动采集和标引技术 索引方式:全文索引和关键词索引 Google,Yahoo和百度等搜索引擎所提供的图像检索服务,它们采用的都是TBIR技术. TBIR的优点:使用成熟的文本检索和搜索引擎技术,符合人们的检索习惯,实现简单 TBIR的缺点:标注的准确性差,也不能满足用户对图像原始特征信息的检索 MPEG-7 国际标准化组织ISO/IEC 制定的MPEG-7国际标准,该标准的正式名称为“多媒体内容描述接口”(Multimedia Content Description Interface),为各类多媒体信息提供一种标准化的描述,并将该描述与所描述的内容相关联,极大地促进了对各种多媒体信息的快速查询和访问。 该标准于1998年10月提出,于2001年最终完成并公布。 MPEG-7标准化的范围包括: 一系列的描述子(描述子是特征的表示法,一个描述子就是定义特征的语法和语义学); 一系列的描述结构(详细说明成员之间的结构和语义); 一种详细说明描述结构的语言、描述定义语言(DDL); 一种或多种编码描述方法。 90年代以来: CBIR (Content-based Image Retrieval) 基于内容的图像检索 对图像的视觉内容,如图像的颜色、纹理、形状等进行分析和检索图像。 其特点是图像本身包含的客观视觉特性,不需要人为干预和解释,能够通过计算机自动实现对图像特征的提取和存储。 CBIR进行检索时利用的是第2层的特征。特征提取是CBIR系统最基础的部分,在很大程度上决定了CBIR系统的成败. [1] 1 基于颜色特征的检索 实践表明,基于颜色的CBIR系统具有较好的性能,而且实现相对容易.最常用的表达颜色特征的方法是颜色直方图。 其他常用的颜色特征表示方法还有颜色矩和颜色相关图。 [2] ? 2 基于纹理特征的检索 纹理是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征,对图像灰度变化的特征进行量化,与对象的位置、走向、大小、形状有关,与平均灰度级无关。 图像检索中用到的纹理特征表示方法主要有:Tamura法、小波变换和自回归纹理模型。 [3] 3 基于形状特征的检索 形状特征常与目标联系在一起,需提取目标的轮廓或描述目标轮廓所包围的区域的性质。因此形状比颜色和纹理的语义性更强。 基于边界的表示:代表方法是傅里叶描述子。其基本思想是用对图像进行傅里叶变换得到的边界作为形状描述. 其中一个优点就是把二维问题简化为一维问题。 基于区域的表示:代表方法是不变矩法。 CBIR系统向用户提供的查询方式 示例查询就是由用户提交一个或几个例子图像,然后由系统检索出特征与之相似的图像.这里的“相似”,指的是上述的颜色、纹理和形状等几个视觉特征上的相似。 草图查询:用户可以简单地画一幅草图,由系统检索出视觉特征上与之相似的图像。 目前基于内容图像检索技术已经取得了不少的成就,一些著名的图像检索系统相继被推出,有IBM的 QBIC 系统,哥伦比亚大学开发的 Visual-SEEK,MIT多媒体实验室开发的 Photo-Book,U C Berkeley开发的 Chabot 系统等。 CBIR利用图像本身固有的物理信息,能够对图像的颜色、纹理和形状等特征进行比较,在指纹识别、商标检索和医学图像检索等特定领域得到了广泛应用,因为这些领域的图像在某些特征上容易识别,比如同一个手指的指纹其纹理是一样的。 然而,Internet上的图像来自不同的领域,根本无法捕获其共同点,用基于内容的方法对这些图像进行检索,其效果远不能令人满意. 基于语义的图像检索 基于语义的图像检索的目的,就是要使计算机检索图像的能力达到人的理解水平。 在图1所示的图像内容层次模型中,语义位于最高层:第3层。第2层和第3层之间的差别被许多学者称为“语义鸿沟” (semantic gap)。缩小语义鸿沟的办法有2种:由高层语义导出低层特征和由低层特征向高层语义的转换。 在原有检索系统中加入高级语义到低层特征的转化,可以在不改变现有的图像特征库和匹配方式的情况下,实现基于语义的图像检索,其基本框图见图2.
文档评论(0)