- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图象检索进展与展望.
图像检索的进展与展望
摘要:随着计算机数据处理能力的提高和多媒体编码技术的进步网络上的各类资源日益丰富基于文本的图像检索技术目前,已经有不少的搜索引擎提供网络图像的检索服务,如Google、Ditto、PicSearch、Ixquick、Mamma、百度等。从20世纪70年代开始,有关图像检索的研究就已开始,主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),回避对图像可视化元素的分析,如绘画作品的作者、年代、流派、尺寸等。一般以关键词形式的提问查询图像,或者是根据等级目录的形式浏览查找特定类目下的图像将图像分为动态图像、照片、图标、背景、艺术剪辑图、插图、壁纸、界面、成套图像8个一级类,下设数量不等的子类。在图像数字化之前,档案管理者、图书管理员都是采用这种方式组织和管理图像。TBIR技术实现较简单,更符合人们检索习惯,减少许多对图像内容本身的复杂考虑其缺点在于,到90年代以后,出现了对图像的内容语义,如颜色、纹理、形状以及目标的空间关系图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。几种基于内容的图像检索方法以直方图为特征的常用匹配方法有:矢量距离法
以图像的直方图在各个灰度级上的值构成特征矢量,按照欧氏距离公式计算特征矢量之间的距离,以这个距离值代表图像之间的差别程度。试验证明,如果选择合适的彩色空间,那么,欧氏距离与人感觉的颜色差别是一致的。直方图交叉法
取两幅图像的直方图在各个灰度级上的较小值,累加后即表示图像之间的相似程度。这种相似度实际上表示两幅图像的公共部分。
直接差值法把直方图在各个灰度级上的值对应相减,并做归一化处理,用差值代表图像之间的差别。如果两幅图像内容一样,则相似度为1。相似度值越小,表示图像间差别越大。
基于纹理特征的检索对图像灰度变化的特征进行量化,与对象的位置、走向、大小、形状有关,与平均灰度级无关。基于形状特征的检索基于语义的图像检索因此形状比颜色和纹理的语义性更强。
基于边界的表示:代表方法是傅里叶描述子。其基本思想是用对图像进行傅里叶变换得到的边界作为形状描述. 其中一个优点就是把二维问题简化为一维问题。
基于区域的表示:代表方法是基于空间关系特征的检索基于空间关系特征的检索空间关系特征可以分为两类:一类是基于图像分割的方法:首先对图像进行自动分割,划分出其中所含的对象或颜色区域,然后根据这些区域对图像索引。这种方法的算法都是自动的,其主要优点是可以从大量的图像中提取边界而不占用用户的时间和精力。然而,如果通用领域内没有经过预处理的图像,这种自动的分割技术效果就不太好。另一类是基于图像子块的方法:它是将图像简单地均匀划分若干规则子块,对每个图像子块提取特征建立索引。这类方法从概念上来说非常简单,但这种普通规则的分块并不能精确的给出局部色彩的信息,而且计算和存储的代价都比较昂贵,因此,在这类方法在实际中应用较少。
CBIR系统一般包括图像处理模块、查询模块、对象库和特征库和知识库图像处理模块图像处理模块包括输入图像和图像特征的提取过程图像输入过程将图像输入到系统当中,类似于文本检索系统中文本内容的录入过程。CBIR系统一般允许用户以全自动或者半自动(需要用户干预)的方式对图像进行分割,标识出需要的对象或内容关键点,以便有针对性地对目标进行特征提取。如用户界面常常提供一组示例供用户选择,或者由用户亲自绘制草图输入系统。 特征提取对用户或系统标明的图像对象进行特征提取处理。特征提取可由人完成,例如人工给出一些描述特征的关键词,也可以通过对应的图像处理程序完成,自动提取出检索用户可能关心的一些图像特征。提取的特征既可以是全局性的,如整幅图像的颜色分布,也可以是针对某个内部的局部对象,如图像中的子区域。特征表示方法有许多,如颜色表示法中就有颜色直方图、颜色矩、颜色集等,纹理表示法中有Tramura纹理特征、基于小波变换的纹理特征表示法。不过,涉及图像高级抽象的特征时,会受到知识领域和检索任务的限制,因此往往需要外界知识提供辅助。 查询模块主要实现检索匹配过程,根据相关度计算方法,实现提问与记录的匹配和筛选,最终得到符合要求的结果反馈给用户。CBIR采用示例查询的方式向用户提供检索接口, 将用户的检索请求转化为可以对数据库进行操作的提问。检索允许针对全局对象,如整幅图像,也允许针对其中的子对象以及任意组合形式来进行。检索返回的结果按照相似程度进行排列输出,如果有必要可以基于得到的检索结果进行进一步的查询。与基于内容检索一样,CBIR实现的是相似性检索,模仿人类的认知过程进行,因此,往往需要在与检索用户不断地交互中提炼检索结果。 对象库与特征库CBIR中的对象库存储了输入的图
文档评论(0)