图像检索技术综述.ppt

下载文档 降价啦

4
0
约3.96千字
约 28页
2017-02-25 发布于天津
举报
版权申诉
保障服务

图像检索技术综述.ppt

1、本文档共28页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

图像检索技术综述.ppt

图像检索技术综述本文主要内容图像检索技术的发展历史当前主流的图像检索技术介绍一个图像搜索引擎的系统模型 20世纪70年代： TBIR (Text-based Image Retrieval）基于文本的图像检索技术沿用了传统文本检索技术，利用文本描述的方式表示图像的特征。早期的TBIR：手工对图像进行注释，工作量相当大，不可避免地会带来主观性和不精确性 Internet环境下的TBIR：网页信息的自动采集和标引技术索引方式：全文索引和关键词索引 Google，Yahoo和百度等搜索引擎所提供的图像检索服务，它们采用的都是TBIR技术． TBIR的优点：使用成熟的文本检索和搜索引擎技术，符合人们的检索习惯，实现简单 TBIR的缺点：标注的准确性差，也不能满足用户对图像原始特征信息的检索 MPEG-7 国际标准化组织ISO／IEC 制定的MPEG-7国际标准，该标准的正式名称为“多媒体内容描述接口”（Multimedia Content Description Interface），为各类多媒体信息提供一种标准化的描述，并将该描述与所描述的内容相关联，极大地促进了对各种多媒体信息的快速查询和访问。该标准于1998年10月提出，于2001年最终完成并公布。 MPEG-7标准化的范围包括：一系列的描述子（描述子是特征的表示法，一个描述子就是定义特征的语法和语义学）；一系列的描述结构（详细说明成员之间的结构和语义）；一种详细说明描述结构的语言、描述定义语言（DDL）；一种或多种编码描述方法。 90年代以来： CBIR (Content-based Image Retrieval）基于内容的图像检索对图像的视觉内容，如图像的颜色、纹理、形状等进行分析和检索图像。其特点是图像本身包含的客观视觉特性，不需要人为干预和解释，能够通过计算机自动实现对图像特征的提取和存储。 CBIR进行检索时利用的是第2层的特征。特征提取是CBIR系统最基础的部分，在很大程度上决定了CBIR系统的成败． [1] 1 　基于颜色特征的检索实践表明，基于颜色的CBIR系统具有较好的性能，而且实现相对容易．最常用的表达颜色特征的方法是颜色直方图。其他常用的颜色特征表示方法还有颜色矩和颜色相关图。 [2] ? 2 　基于纹理特征的检索纹理是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征，对图像灰度变化的特征进行量化,与对象的位置、走向、大小、形状有关,与平均灰度级无关。图像检索中用到的纹理特征表示方法主要有：Tamura法、小波变换和自回归纹理模型。 [3] 3 　基于形状特征的检索形状特征常与目标联系在一起，需提取目标的轮廓或描述目标轮廓所包围的区域的性质。因此形状比颜色和纹理的语义性更强。基于边界的表示：代表方法是傅里叶描述子。其基本思想是用对图像进行傅里叶变换得到的边界作为形状描述. 其中一个优点就是把二维问题简化为一维问题。基于区域的表示：代表方法是不变矩法。 CBIR系统向用户提供的查询方式示例查询就是由用户提交一个或几个例子图像，然后由系统检索出特征与之相似的图像．这里的“相似”，指的是上述的颜色、纹理和形状等几个视觉特征上的相似。草图查询：用户可以简单地画一幅草图，由系统检索出视觉特征上与之相似的图像。目前基于内容图像检索技术已经取得了不少的成就，一些著名的图像检索系统相继被推出，有IBM的 QBIC 系统，哥伦比亚大学开发的 Visual-SEEK，MIT多媒体实验室开发的 Photo-Book，U C Berkeley开发的 Chabot 系统等。 CBIR利用图像本身固有的物理信息，能够对图像的颜色、纹理和形状等特征进行比较，在指纹识别、商标检索和医学图像检索等特定领域得到了广泛应用，因为这些领域的图像在某些特征上容易识别，比如同一个手指的指纹其纹理是一样的。然而，Internet上的图像来自不同的领域，根本无法捕获其共同点，用基于内容的方法对这些图像进行检索，其效果远不能令人满意．　基于语义的图像检索基于语义的图像检索的目的，就是要使计算机检索图像的能力达到人的理解水平。在图1所示的图像内容层次模型中，语义位于最高层：第3层。第2层和第3层之间的差别被许多学者称为“语义鸿沟” (semantic gap)。缩小语义鸿沟的办法有2种：由高层语义导出低层特征和由低层特征向高层语义的转换。在原有检索系统中加入高级语义到低层特征的转化，可以在不改变现有的图像特征库和匹配方式的情况下，实现基于语义的图像检索，其基本框图见图2.