语义图像检索的研究进展.docVIP

下载本文档

0
0
约3.36千字
约 8页
2018-11-06 发布于福建
举报
版权申诉

语义图像检索的研究进展.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语义图像检索的研究进展

语义图像检索的研究进展　　【摘要】本文探讨了基于语义图像检索相关技术，并且通过对语义图像检索技术的了解，我们讨论了语义图像检索存在的问题与其的发展方向。本文的研究具有重要的理论价值，同时为语义图像检索的发展起到启迪的作用。　　【关键词】语义；图像检索；研究；进展　　中图分类号：TN911.73 文献标识码：A 文章编号：　　一、前言　　在当今社会发展不断快捷的今天，人们有时候需要快速地检索出自己需要的图像，但是现在的图像信息是巨大的，这时候我们就需要某项技术能够帮助人们更快的找到我们需要的图像，基于语义的图像检索技术就是检索图像的方式之一，相信通过对其的研究能够达到更好的图像检索效果。　　二、基于语义图像检索相关技术　　1、图像语义模型　　由于人们对图像内容的理解有着不同的层次，有人从图像的颜色去理解，有人从图像的对象去理解，也有人从图像所表现出来的行为去理解，也就是说图像的语义是具有不同层次的。王惠锋、孙正兴在他们的文章中给出了一个图像语义层次模型所示。他们把图像的语义定义为六个层次，从上到下依次为，特征语义，是指图像低层物理特征(颜色、形状、纹理)及其之间的相互组合，如蓝色的天空、红色的太阳；对象语义，是指图像当中出现的具有一定意义的对象，如一条狗、一座山；空间关系语义，是指图像各个对象之间的空间关系，如人旁边有条狗，狗旁边有只猫；场景语义，是指所有图像中对象所在的背景环境，如学校、森林；行为语义，是指图像内容所表现出的某种行为。　　2、图像语义表示　　如何描述图像的语义对语义的提取以及检索的效率有着十分重要的影响。语义的表示不仅要把图像的内容准确而客观的描述出来，对不同的内容有着不同的抽象，而且表示形式应当尽量简单、直观，同时考虑不同用户的不同需求。目前图像语义的表示方法大概有以下几种。　　（1）文本形式。文本形式是最简单，也是最直观的图像语义表示方法。它是用关键字对整幅图像或图像的区域进行注解，另外还可以利用 WordNet[26]将关键字之间的语义关系联系起来，而且它具有一定地同义词解析以及模糊匹配的能力。目前大多数的图像检索系统都是采用这种方法来表示图像语义的，比如 IRIS 系统。但其不足之处也相当明显，它对具有复杂丰富内容的图像显得无能为力，而且自动获取这些关键字也存在着相当大的困难。　　（2）知识表示方法。它是基于人工智能中的一些知识表示方法，如语义网络、框架、数理逻辑以及基于 Agent 表示等。近年来，研究人员提出了采用模糊布尔模型和概率布尔模型。　　3、图像语义的提取方法　　语义提取的最终目标是要将图像库中的每一幅图像用一定的语义表示。目前对图像语义的提取主要包括3个关键的处理过程:图像的视觉特征提取、图像中对象的识别以及基于域知识的推理。图像检索中的语义内容提取算法可以分成三大类:根据图像的底层特征直接自动提取语义内容、建立基于关键字的语义网络、基于语义向量的方法。　　（1）底层视觉特征到高层语义的直接映射　　图像的语义通常在一个高层次上描述图像内容，无论提取到的底层特征是什么，都很难用这些特征直接推导出语义。因此，现已提出的图像语义的提取方法多侧重于将底层的视觉特征直接映射到高层语义。即系统提取图像底层特征，而用户加人高层知识，通过采用语义分类技术，从底层特征中不断地分类学习从而获得高层语义阅。　　大多数情况下，获取图像高层语义都需要使用机器学习技术，通过有监督和无监督的学习将图像归并到某种语义类，在一定程度上获得图像的语义标注信息。　　①图像的分类　　由于语义相关的图像具有相似的可视特征，使得根据提取的底层特征对图像进行语义分类成为可能。有监督的分类方法首先通过学习、训练事先给定的经过语义标注的一组样本图像，获得图像语义分类器，然后利用分离器将未标注或未归类的图像归并到某一语义类，即可获取图像的语义信息。　　②图像的聚类　　图像聚类是典型的无监督学习技术，它的原理是将图像集分组为多个聚类，使得位于同一聚类内的图像相似度尽可能大，而位于不同聚类的图像的相似度尽可能小，然后利用统计方法为每个聚类添加一个类标签，以获得各个图像聚类中的语义信息。图像聚类最常用的技术是传统的k一means聚类及其变形。　　（2）基于关健字的语义网络　　语义网络由一组与图像库中图像链接的关键字表示，并为每个链接赋予权值W，表示此关键字与图像的相关程度。一幅图像可以对应多个关键字，一个关键字也可以对应多幅图像。　　首先通过对图像库中的一部分图像进行手工标注关键字，建立初始语义网络。然后对语义网络进行训练，通过相关反馈技术来完善语义网络。随着检索次数的增多，关键字的个数也会增多，关键字与图像的链接也会增多，并利用相关反馈信息自动调