网站大量收购独家精品文档,联系QQ:2885784924

Web图像检索技术综述.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精品文档(可编辑) 值得下载 Web图像检索技术综述 【摘 要】多媒体技术的迅速发展,促进了Web图像检索技术的创新和发展。针对目前的发展状况,本文对Web图像检索技术做了深入的分析和研究,包括基于文本检索、基于内容检索、语义检索以及个性化Web图像检索,并详细介绍了这4种流行图像检索技术的技术特点,最后指出了Web图像检索技术的发展趋势和研究方向。 【关键词】基于文本图像检索 基于内容的图像检索 基于语义检索 个性化Web图像检索 一、引言 目前,Web图像检索技术和模型层出不穷,可大致分为基于文本的检索、基于内容的检索、语义图像检索和个性化的Web图像检索四种。下面分别对其进行介绍。 二、基于文本的图像检索 20世纪70年代,基于文本的图像检索技术(TBIR)得以发展。目前,该技术发展较为成熟,但需要较多人工参与,耗费大量的人力和时间,而且不同的人对同一张图像的理解也不相同,这就导致对Web图像标注没有统一标准,因而检索的结果不能很好地符合用户的需求[1]。同时在互联网环境中,Web图像数据不断动态更新,采用人工方式对图像进行广泛标注也无法实现。 三、基于内容的图像检索 上世纪90年代,基于内容的图像检索(CBIR)技术产生。它主要采用图像的视觉特征来表示图像的内容,然后通过特征匹配算法进行图像检索。 (一)图像特征提取 图像的特征主要包括底层特征和语义特征。目前的CBIR系统主要使用图像底层特征来检索图像。底层特征主要包括图像的颜色、纹理、形状等定量特征。目前,颜色特征主要有颜色直方图、颜色矩和颜色相关图等。纹理特征有Gabor变换、塔式小波变换、灰度共生矩阵等。而形状特征表示主要有基于边界表示法和基于区域表示法。此外,近些年许多学者也研究了基于文本和视觉两种信息在内的Web图像检索,如文献[2]中提出一种融合文本关键词和图像视觉内容的Web图像检索方法,在一定程度上提高了Web图像检索质量。 (二)图像相似性匹配 图像检索的匹配策略大致分为完全匹配和相似性匹配。完全匹配是指两张图像的特征完全相同时图像匹配成功;而相似性匹配是指两张图像特征间的距离在某一阈值内匹配成功。在基于内容的图像检索中,图像底层视觉特征对比的相似性检索匹配占据着主导地位。 四、基于语义的图像检索 底层的视觉特征不能代表图像丰富的内涵,使得基于内容的图像检索效果并不理想。因此,出现了基于图像语义的检索技术,主要包括语义层次模型、语义的提取方法和语义表示方法三方面内容。 (一)语义层次模型 图像语义是有粒度的,即具有层次性,所以可采用多层结构对图像语义进行分析。 一般,根据图像内容可将图像分为特征语义、对象和空间关系语义、高层语义3个层次。特征语义利用图像的视觉特征及其组合进行检索。对象与空间关系语义,是分析图像中对象的视觉特征、空间关系、位置等信息,得到图像的语义描述。高层语义涉及到图像的场景语义、行为语义和情感语义,该层语义是根据人的知识理解而来,主观性较强,提取工作较复杂。 (二)语义提取方法 图像语义的提取是由底层特征向高层语义映射的过程,但现今的技术水平,直接根据底层的视觉特征推理出图像高层语义很困难,目前主要方法有基于知识语义提取、基于人工交互语义提取和外部信息的语义提取。 (三)语义表示方法 语义表示方法主要有文本表示法和基于人工智能知识表示法。文本表示法是用文本对图像或图像区域进行解释。基于人工智能的知识表示方法,如语义网络、数理逻辑等,该方法能够表达较为复杂的关系,具备较强的模糊匹配能力,但目前通用性的知识表示模型尚不存在。 五、个性化Web图像检索 随着多媒体技术的飞速发展,图像的数量急剧增加,为了得到更准确的符合个人需求的检索结果,个性化Web图像检索成为研究热点。个性化的实质是针对不同用户采用不同策略来提供不同的服务内容。个性化图像检索则是根据用户对检索结果的反馈主动学习和记录用户的兴趣信息,推测出用户的兴趣需求。用户兴趣模型(User Preference Profile)是个性化图像检索的核心,它用于存储和管理用户兴趣信息,通过收集用户的反馈信息,建立初始用户兴趣模型,经过长期地学习,不断更新用户兴趣模型,最终可以得到用户的兴趣倾向,针对不同用户提供个性化服务。 由于获取用户兴趣面临低层特征和高层语义之间的“语义鸿沟”问题,一些学者作了研究,如HE等人[3]提出了一种应用于个性化图像检索的用户兴趣模型的构建方法,以弥补语义鸿沟。QIU等 [4]提出基于用户多媒体数据管理模型的个性化图像检索,建立用户多媒体数据管理模型为用户提供个性化图像检索。文献[5]为了在个性化搜索过程中能够准确地挖

文档评论(0)

linsspace + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档