一种基于SVMS语义图像分类方法.docVIP

下载本文档

1
0
约4.63千字
约 9页
2018-08-13 发布于福建
举报
版权申诉

一种基于SVMS语义图像分类方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种基于SVMS语义图像分类方法

一种基于SVMS的语义图像分类方法　　摘要:如何跨越图像低层视觉特征到高层语义特征的“语义鸿沟”已成为语义图像检索问题的关键，首先将待分类图像分成五个区域;然后在提取图像底层特征的基础上，采用基于支持向量机组(SVMS)的方法建立图像低层视觉特征到高层语义特征之间的映射，将一幅图像同时归入一类或几类图像语义。实验结果表明，该方法具有较好的检索查全率和准确率。　　关键词:语义图像检索; 底层特征; 高层语义; 支持向量机　　中图分类号:TP317.4文献标志码:A 　　文章编号:1001－3695(2008)02－0452－03 　　　　随着Internet和多媒体技术的发展，现代信息处理的对象与方法均有很大的变化。数字图像作为现代信息传播的重要媒体，其数量的猛增使得对其进行快速#65380;高效的检索要求愈来愈强，基于内容的图像检索得到了大力发展。该方法紧紧围绕物理属性，提取诸如色彩#65380;纹理#65380;形状等图像特征，将图像视为这些属性特征向量之一或组合，图像的检索就转换为代表图像内容的特征向量间距离的比较。然而底层特征与人类对图像的理解往往存在很大的差异，用户无法理解底层特征如何影响图像的视觉效果。人们主要根据图像的含义来判断图像是否符合自己的需要，这些图像含义即是图像的高层语义知识[1]。基于语义的图像检索方法试图从图像内容所反映的语义和概念角度进行图像检索，然而两者的衔接存在一定的鸿沟，主要是由于图像的底层特征与其描述的对象之间存在距离，缺乏一个有效融合两者的方法，因而如何跨越低层视觉特征和高层语义特征的鸿沟是语义图像检索中一个难点。许多学者为此作了不少研究和贡献[1~9]。图像语义检索系统早期的一个例子是GRIM_DBMS[2]，它的目标是在一些特定的领域解释和检索线条;C.Colombo等人[1]进行了艺术图像的语义检索的探索，他们首先建立了一系列将图像视觉内容映射到图像语义的规则;S.Chang等人[5]提出语义模板的概念用于建立低层视觉特征与高层语义之间的联系;Zhao Rong等人[6]提出LSI(latent semantics indexing)用于建立低层视觉特征和高层语义之间的联系;鲍永生等人[7]提出语义网络用于建立低层视觉特征与高层语义之间的联系;孙志杰等人[9]提出支持向量机(SVM)用于建立低层视觉特征和高层语义之间的联系。但是该方法将一幅图像归于一类语义图像，当一幅图像归类不是很明显时，如一幅包括海洋#65380;日落#65380;蓝天的图像，不能将其同时归入相应的几类语义图像。　　为解决这一问题，本文采取将待分类图像分成五个区域，对每个区域提取其底层颜色特征和纹理特征，然后　　采用基于支持向量机组的方法建立低层视觉特征和高层语义之间的联系，从而将一幅图像归于一类或几类语义图像。　　　　1图像底层特征的提取　　　　提取图像底层特征是图像检索的主要问题之一，而语义检索是基于人感知的，带有人的主观性，所以选取的图像特征本身要具有较为直观的视觉意义，即较强的视觉表达能力。在具体应用中，底层特征的选择必须最大程度支持目标的检索，考虑到实验所用到的风景图像的颜色特征和纹理特征均比较丰富的特点，本文在将一幅图像分成五个区域的基础上，在五个区域上分别提取颜色和纹理特征来描述视觉感知层。　　1.1颜色特征的提取　　颜色是彩色图像的一种重要的视觉特征，对于旋转#65380;平移#65380;尺度变化均不敏感，表现出很强的鲁棒性。在HSV颜色空间中能较好地反映人对色彩的感知和鉴别能力。对RGB模型，笔者将其分别均匀量化成64级，对HSV模型非均匀量化成162级[10]，然后在此基础上，分别对其计算颜色直方图和累积直方图。　　　　其中:k表示图像的特征取值;L是特征可取值的个数;n??k是图像中具有特征值为k像素的个数;N是图像像素的总数。　　　　3实验分析　　　　本文选取的图像库来自于/~cil/v－images.html，选取河流#65380;山川#65380;海洋#65380;草原等六类语义图像类。选取其中的600幅图像(每类平均100幅)作为训练集，为了尽量使每幅图像只包含一类景物，本文先按图3的方法对其进行粗分割;然后对每个区域分别在RGB颜色空间和HSV颜色空间提取直方图#65380;累积直方图#65380;颜色距三种颜色特征，维数分别为182#65380;181#65380;9和162#65380;161#65380;9，同时使用Gabor小波变换[11]提取32维纹理特征向量。通过学习构造相应的SVM分类器，分别对应图像库中的六类语义。　　将图像库中的大约6 000幅图像在训练好的每个支持向量机上进行语义