- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容图像检索技术简析
基于内容图像检索技术简析
摘 要: 基于内容的图像检索技术是新一代多媒体计算机的核心技术。本文介绍了基于内容的图像检索系统的关键技术,分析了现有的图像检索技术的缺陷,并提出了将来的研究方向。
关键词: 基于内容 图像检索 关键技术
1.引言
随着多媒体和计算机网络技术的迅速发展,多媒体信息的数据量正在以惊人的速度增长。面对日益庞大的数据信息,如何更加有效地分类、管理、维护和利用是多媒体数据挖掘中亟待解决的问题。多媒体数据挖掘中的研究的热点之一就是对图像的检索。目前主要有两种方式的检索:(1)基于描述的检索系统;(2)基于内容的检索系统。
传统的图像检索方法是基于文本的(Text-Based Image Retrieval,简写为TBIR)。这种技术是对图像建立关键词等文本描述信息,以解释图像的内容。然后使用关系数据库结构化查询语句来对关键字进行检索。因此,对图像的检索变成了对关键字的查找,这种方法简单易行,但是随着图像的数量与日俱增,以及图像数据来源的日益广泛,以下两个缺点就更加凸显。首先,文本描述难以充分表达图像的丰富内容。文本描述是一种定性的描述,描述能力有限,图像中则往往含有大量需要定量描述的信息。而且许多图像的特征难以用文本描述表达,如图像中的不规则形状、散布的纹理等就很难用文本来描述。基于文本的图像检索难以实现基于图像视觉特征和空间关系的相似性检索。其次,文本描述是非常主观的,不同的人对同一幅图像数据可能有不同的理解,因此当用户在查询时输入的关键词和数据库中的关键词不一致或这些关键词根本就不存在时,将导致查询失败。最后,随着图像数量的日益增多,人工标注或添加信息效率较低,并且一旦标注信息建立就不便于更新,难以满足海量环境下多媒体信息库的检索要求。为了克服基于文本检索方法的局限性,20世纪90年代出现了基于内容的图像检索技术,这种技术对图像的内容,融合了图像理解技术,可以提供更加有效的检索途径。
2.基于内容的图像检索系统组成
基于内容的图像检索(CBIR,Content-Based Image Retrieval),是指直接采用图像内容进行图像信息查询的检索,在建立图像库时,对输入的图像先进行图像分析,提取图像的特征向量,并在将输入图像存入图像库的同时将其对应的特征向量也存入相应的特征库。在进行图像检索时,对每一幅给定的查询图,进行图像分析并提取该图的特征向量。通过将该图像特征向量与特征库中的特征向量进行匹配并根据匹配结果到图像库中搜索就可提取出所需要的检索图来。随着图像特征理论的逐渐完善,人们认识到图像检索系统的用户主观性及视觉特征与语义特征难以匹配的问题,开始把用户看作检索系统的一部分,将文本检索中的相关反馈技术引入到基于内容的图像检索中。
图像的特征提取、图像特征索引技术、图像相似度度量、相关的反馈机制是研究开发基于CBIR的图像检索系统的四种关键技术,也是解决检索问题和提高检索效率的关键。
2.1图像特征的提取与表达
图像特征的提取与表达是基于内容的图像检索技术的基础。图像的视觉特征分为通用的视觉特征和领域相关的视觉特征。前者描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括色彩、纹理和形状,后者建立在对所描述图像内容的某些先验知识(或假设)基础上,与具体的应用紧密有关,如人的面部特征或指纹特征等。
2.1.1颜色特征作为图像最直观最明显的特征,已经得到广泛的应用,其主要原因在于颜色往往和图像中所包含的物体或场景十分相关。此外,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的检索性。图像颜色特征的表达涉及如下三个方面的问题:一是选择一个合适的颜色空间;二是将颜色特征量化为向量形式;三是定义一种相似度(距离)标准用来度量不同图像之间在颜色上的相似性。
恰当的颜色空间的选择是实现基于颜色特征的图像检索的基础。常见的有RGB颜色空间和HSV颜色空间。一般情况下获取的图像都是在RGB空间描述的,但是RGB空间结构并不符合人们对颜色相似性的主观判断。而HSV颜色空间由色调(H)、饱和度(S)、亮度(V)三个分量组成。与人眼的视觉特性比较接近,从人的心理感知来说,HSV空间要比RGB空间更直观、更容易接受。因此,为了更符合人眼的视觉特征,我们经常需要做颜色空间的转换,将RGB颜色空间转换为HSV颜色空间。
表示图像颜色特征最简单的方法是颜色直方图方法。它所描述的是不同色彩在整幅图像中所占的比例。它仅仅表示了图像中各种颜色的统计分布,两幅内容完全不同的图像,也可能有相同的颜色直方图,所以不能够反映出同一色彩在空间分布的不同,因而造成空间信息的丢失。所以这种方法只适合描述那些不需要考虑物体空间位置的图像。
文档评论(0)