基于图像注释与检索的SVM应用研究.docVIP

下载本文档

3
0
约 5页
2016-10-03 发布于北京
举报
版权申诉

基于图像注释与检索的SVM应用研究.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于图像注释与检索的SVM应用研究.doc

基于图像注释与检索的SVM应用研究　　摘要：基于内容的图像检索技术产生时代背景、研究过程、目前研究程度及相关技术，本文进行了研究。论述了SVM的技术原理；并综述了前人对SVM应用在图像标注检索上做相关工作，对这些工作的优缺点通过分析比较，引出以后研究需要解决的问题和有益可行的方法。在前人的成功经验的基础上，该文提出了一种新的算法：多个SVM与主动学习能够增强检索性能，每个SVM的分类结果可以通过不同的计算确信度方法来评估，以达到很好的效果。　　关键词：SVM 图像检索图像标注　　中图分类号：TP391.41 文献标识码：A 文章编号：1674-098X（2013）05（a）-0016-01 　　1 图像检索综述　　随着多媒体技术的快速发展以及网络和生活中图像数据的大量涌现，在多媒体技术研究中，大家关心的热点问题是如何从中快速、有效地找到有用的图像，在这样的背景下就产生了图像检索。图像检索发展阶段划分一般为基于文本、内容、语义。　　图像检索方法基于文本的大家都很熟悉了，需要每幅图片都提前用关键字标注，我们常用的google、yahoo、baidu都是这种用文本检索的方式。它的优点是检索简单方便人性化，但是缺点就是简单的文本难以充分表达图像丰富内容、人为标注主观性比较大，另外对于大型的图像数据集，手工标注效率太低。因此，如何快速、有效地实现对图像的自动语义标注就变得很必要。于是基于内容的图像检索技术就产生了，它首先提取图像的低层特征，通过计算图像库中图像低层特征与查询图像低层特征之间的相似度获得最终的检索结果。　　CBIR的优点是用低层特征取代了文本来表示图像的内容，能够自动进行图像匹配，无需要求图像库中的图像必须含有本文标记。缺点也很明显就是低层视觉特征与人类的视觉机制明显不一致，高、低层语义特征之间存在很大的语义差异，比如语义特征和语义概念并非一一对应，比如草地树叶都是相同的绿色，但语义不同。即使语义概念相同，其低层特征也不一定相同，如苹果有红色的也有绿色的。因此如何缩小“语义鸿沟”，建立低层特征与高层语义之间的关联是目前需要迫切需要解决的问题。　　2 SVM分类方法研究　　SVM实际上是一种分类方法，其基本思想：对于相关分类问题，在高维空间里，利用其中一个最优分类超平面做为分类平面，从而达到最小的分类错误率的效果。　　对于线性可分的情况，最终目标是找到这么一个分类超平面能够把正负两类样本最大化地分开，最终的目标函数既保证了两类间隔最大，又保证了分类错误率最小，通过引入拉格朗日乘子得到最后的判别函数。　　对于非线性可分的情况，特定函数也称为核函数，通过其非线性映射变换到高维特征空间的过程中寻找最优线性分类面。　　常用的核函数有这三种。对于多类分类问题，仍然可以采用SVM来解决。一般有一对一和一对多两种策略。一对一策略：任取其中两类训练一个SVM，从而就可以训练k（k-1）/2个SVM，这个数目是比较大的，因此常采用第2种方法一对多的，一对多，是取其中任一类作为正类，其他都作为负样本训练一个SVM，这样需要训练k个SVM。　　图像注释虽然有多种方法，但基于分类的方法是比较好的一种方法，每个语义关键字或者语义概念能够被做为独立的类来对待，能够为每个语义概念训练一个分类器从而实现将图像分类进而注释的效果，而SVM由于它的优点常被用来进行图像注释。　　2003年Cusano首先将SVM用在图像注释中将图像区域分到七个具体的类。2005年King等人结合一类SVM和二类SVM来提高注释的精度，随后2006年Chang等人为了提高图像注释的性能，一是在不对称损失函数引入了假相关实例、假不相关实例，二是把多实例学习和SVM充分结合起来，取得了较好的效果。　　但是这些方法都没有考虑到样本不平衡问题，因为为了减少分类器的数目，大家都使用一对多的策略来运用SVM，但是这样一来，正类样本数目会远远小于负例样本，大规模不平衡数据会对SVM分类产生很大影响，被J.Yuan等人研究证实了。但是，对于现存的分类器，大型的图像数据集中，存在语义类别丰富、训练学习时间过长等问题。　　3 SVM在图像检索中的应用　　SVM常与相关反馈来结合来提高检索性能。在P.Hong等人研究中，将SVM引入反馈算法，通过正样本到最优分类面的距离来计算其相关度。用户只需标明正负样本，系统就可以通过这些反馈样本学习，哪一个样本距最优分类面最远，其获得的权重最大。在L.Zhang等人研究中，训练学习一种SVM分类器，可以把图像分为相关与不相关两类，直接通过SVM的输出来进行排序，把最大值的前n幅图像进行返回输出。在Y.Chen等人的研究中，仅仅考虑正反馈样本，利用一类SVM估计相关图像特征的支持效果。