基于内容的图像检索综述-Read.DOC

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于内容的图像检索综述-Read

基于内容的图像检索综述 前言 伴随网络时代数字家庭概念的产生,20世纪年代多媒体技术发展可获取的图多媒体数据增。如何组织、表达、存储、管理、查询和检索这些海量的数据,是对传统数据库技术的一个重大挑战如果对数据有效,大量信息将淹在的海洋之中。因此,如何将数字处理、模式识别技术、计算机视觉技术与传统数据库技术结合起来,建立高效的图检索机制成为迫切需要解决的问题。 (1)突破了关键词检索基于文本特征的局限,直接从媒体内容中提取特征线索。 (2)检索方式多种多样。基于内容的图像检索可以提供浏览方式、基于实例的检索方式以及基于草图的检索方式等等。 (3)人机交互式检索。基于内容的图像检索系统通常采用参数调整方法、聚类分析方法、概率学习方法和神经网络方法等,通过人机交互的方式来捕捉和建立图像低层特征和高层语义之间的关联,即相关反馈技术。 (4)相似性匹配检索:基于内容的检索是按照一定的匹配算法将输入图像的特征与特征库中的特征元数据进行相似性匹配,将满足一定相似性的一组初始结果按照相似度大小排列,提供给用户。 尽管CBIR相对于TBIR有了很大进步,但是这种基于机器对图像各种特征的理解在某些场景中不能替代基于文本的描述,比如一幅图像下面可能蕴含着某种寓意或者一个事件,但是单纯从内容是无法获取这一切的,如果能将对图像的注解应用于基于内容的检索,无疑将极大的提高检索查准率。 在Internet环境下,MPEG专家组制定了一个基于内容的多媒体描述方案,即MPEG-7[3]标准,对各种不同类型的多媒体信息内容的描述方式进行了标准化定义,从而实现CBIR与TBIR的互连。 基于内容的图像检索 图像的内容包括图像的视觉信息等物理特征,还包括视觉特征所带来的高层语义特征。物理特征属于低层视觉信息,主要包括颜色、纹理、形状;语义信息属于图像的高层视觉信息,主要包括对象、空间关系、场景、行为、情感等图像内容。 基于内容的图像检索的目的一般可为三类:(1)准确查询,找出一致的复制件;(2)范围查询,找出与输入图像特征相差在一定范围内的图像;(3)K-最近邻查询,根据输入图像与待检测图像的相似度对检索结果进行排序[2]。 3.1 CBIR的应用 对图像内容检索的研究起步于二十世纪80年代,到了网络技术逐渐普及的90年代才取得较大的突破,多种成果开始转化为应用技术,而日益增长的应用需求反过来推动其研究向更高的层次发展。如下领域开始应用和驱动图像检索技术的发展。 防止犯罪等司法部门 应用人脸识别技术,根据专家对犯罪嫌疑人的头像特征的描绘图像,定位犯罪人的真实面目。 军事领域 可以用于武器的精确制导,通过实时获取的图像信息,对其进行解译,保证打击的准确性。 版权保护领域 针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。 建筑和工程设计 通过对建筑及工程设计物体的图像检索,可以聚类相同风格特色的建筑及工程设计产品。 广告业、艺术设计 应用图像检索,可以找到需要的各种素材,进行艺术设计的再创造。 医学领域 对各种医学透视CT图像进行检索,可以快速定位类似病例,及时快速的帮助病人找到病因,会对临床、医学研究、远程医疗、异地会诊乃至医学教育等方面产生积极和深远的影响’,则F’所对应的图像P’即为与P最相似的检索结果[1]。CBIR系统典型的架构如下所示。 系统主要包括用户界面、检索和存储系统三部分,其中图像特征索引技术和相似度匹配技术是系统的核心部分,直接影响着系统检索的查全率和查准率。其中检索和存储系统都要对原始图像进行特征向量计算,不同之处在于索引库的生成采用离线方式,而查询检索部分需要实时在线计算。匹配度的计算将决定检索结果的产生以及结果的排序,因此也具有十分重要的意义。 除此之外,图像检索一般不是一蹴而就的过程,中间需要用户的干预和交互,应用反馈模型可以增强系统的理解能力,从而提高查准率。 3.3 图像内容的索引表示方法 3.3.1 低层图像特征 颜色特征 颜色是图像最显著的特征,具有稳定,旋转、平移、尺度变化无关性,而且颜色特征计算简单,表现出很强的鲁棒性,因此基于颜色的检索成为现有图像检索系统中应用最基本的方法。基于颜色特征的图像检索需要解决三个问题:颜色的表示、颜色特征的提取和基于颜色的相似度量[2]。 颜色的表示取决于色彩空间的选择,不同的场合采用的方式也是不同,在大多数彩色图形显示器使用红、绿、蓝三原色,但RGB色彩空间中不能与人的感知颜色相联系。在所有的色彩空间中,HSV模型(Hue,Saturation,Value)对应于画家配色模型,具有与人观察颜色方式相一致的特点,能较好反映人对色彩的感知和鉴别能力,其中H代表色度(0≤H≤360°),S代表饱和度(0≤S≤1),V代表亮度值(0≤V≤1)。对于不同格式的图像文件,需要将其转化到对应的颜色空间

文档评论(0)

wumanduo11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档