图像检索技术进展综述.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图像检索技术进展综述.doc

图像检索技术进展综述 甘晨,易法令,王圆妹 长江大学计算机科学学院 434023 摘要 对图像检索技术的发展进行了深入地分析,详细论述了每个阶段的技术特点,介绍了现有的各种检索技术,包括基于文本的图像检索、基于内容的图像检索和基于语义的图像检索,指出了目前研究中存在的主要难点和不足,同时指出了图像检索技术的发展趋势和研究方向。 关键词 图像检索 特征融合 语义 标注 1 引言 近几年图像搜索是增长速度最快的分类搜索应用,全球几大搜索引擎的图像搜索次数均成倍增长。因此图像检索技术成为国内外研究的热点,也成为未来信息高速公路、数字图书馆等重大项目中的关键技术。 本文对于现有的信息检索技术进行了系统的分析和比较,重点介绍了基于文本的图像检索、基于内容的图像检索和基于语义的图像检索这三种技术。 2 基于文本的图像检索 早在20世纪70年代,各国的科研人员就开始研究如何有效的管理图像数据,当时采用的技术主要是基于文本的图像检索技术(TBIR),是指利用手工输入文本的方式为图像输人一系列的关键字,然后将图像的存储路径和图像关键字之间建立联系,图像检索实际上变成 了文本检索,这种方法简单易行,用传统的关系数据库就可以实现,但也存在一些缺点,如手工输人关键字的工作量过大,标识海量图像数据的关键字是不切实际的,而且手工标识不可避免地会带有个人的主观性和不确定性,毕竟不同的人对于同一幅图像的理解可能是不相同的。 在为世纪即年代后期,网页信息自动采集和标引作为搜索引擎的重要部分,得到了深人的研究,Google、Yahoo等搜索引擎纷纷推出采用此技术的图片搜索功能。显然这种自动标引所采集的图像标识是很粗糙的,准确性不高,有时甚至是不准确的,例如以“湖北荆州”为关键字进行检索,会检索出很多与湖北荆州无关的图片出来。 3 基于内容的图像检索 为了克服基于文本的图像检索技术的局限性,20世纪90年代以来,基于内容的图像检索技术(CBIR)得到了极大的发展。CBIR技术主要是指在图像处理的基础上,利用图像的颜色、形状、纹理、轮廓以及对象的空间关系等基本视觉特征进行检索。与TBIR不同的是它利用了图像本身包含的客观的视觉特征,能通过计算机自动实现对图像特征的提取和存储等,提高了图像处理速度,有利于实现图像索引和检索的自动化实现。目前,已有很多成型的基于CBIR技术的系统运行,如MTT的Photo Book和UIUC大学的MARS等。 3.1基于内容的图像数据库结构 通过运用面向对象的数据库技术,大型的数据库已经可以摆脱了传统的关系数据库的局限。由于研究的角度不同,可以分为图像数据库的体系结构和框架结构。目前比较完善的图像数据库的结构共分为五层,分别是用户视图、语义特征视图、图像特征视图、特征表达、特征的组织和检索。用户视图层主要是对图像进行空间推理;语义特征层主要是对某一图像特征在特定领域中的语义信息进行描述;图像特征视图层主要是分析图像的内容,如图像的空间关系、形状、色彩等;特征表达层可以支持同一特征的多种表示,解决了对于一种视觉内容特征的特征表达不唯一的问题;特征的组织和检索层相当于传统数据库中的物理存储机构。我们目前正处在第3阶段,即支持图像内容的检索阶段。虽然有一些图像数据库以 关键词方式对数据语义特征进行检索,但这种检索是脱离图像的具体内容的。 3.2图像的底层特征提取 特征提取是CBIR系统最基础的部分,在很大程度上决定了CBIR系统的成败。在图像检索过程中,用户一般对颜色、纹理、形状和目标的空降关系等特征比较敏感,下面就根据这些特征进行分类介绍。 由于颜色特征具有的平移、尺度和旋转等不变的特性,而且颜色特征是人类辨别物体的主要方式,所以基于颜色特征的检索技术是目前基于内容的图像检索中的最基本的方法。最常用的表达颜色特征的方法是颜色直方图。颜色直方图描述的是不同色彩在整幅图中所占的比例,具体算法比较成熟,缺点是丢失了图像的空间信息,该检索技术今后的研究方向是与其它视觉特征相结合进行多特征的检索研究。 纹理是指图像中所具有的局部不规则而宏观有规律的特性,纹理特征可用来对图像中的空间信息进行一定程度的定量描述。目前纹理分析的方法基本可以分为统计法、结构法、模型法和空间/频率联合分析法这四类。目前存在的主要问题是计算机提取的纹理特征不能很好的对应人类视觉感知,毕竟人们对于纹理的视觉特征的认识是非常主观的。随着小波变换在图像纹理分析中的广泛应用,今后研究的重点将放在小波变化和共生矩阵相结合同时实现基于统计和基于变换的纹理分析的研究上来。 图像中物体和区域的形状是图像表达和图像检索中的重要特征,它的表达也更复杂,它常与目标联系在一起,具体实现的方法可以分为两类:基于轮廓的方法和基于区域的方法。前者指的是物体的外边界,而后者则关系到整个图像区域。目前基于

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档