基于受限随机选择和检索结果集的相关反馈.docVIP

下载本文档

1
0
约4.33千字
约 8页
2018-03-16 发布于北京
举报
版权申诉

基于受限随机选择和检索结果集的相关反馈.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于受限随机选择和检索结果集的相关反馈　　摘要：本文将相关反馈看成一个二分类问题，从反馈中固有的问题和用户的需求为出发点，在传统的移动查询点的基础上，提出了改进的基于受限随机选择和检索结果集的图像检索相关反馈系统。实验证明，该方法很好的解决了反馈中固有的小样本问题和正负样本不对称的问题。同时，综合利用用户的反馈信息，在较少的反馈次数内得到了较好的检索准确率。　　关键词：相关反馈；SVM；受限随机选择；检索结果集　　中图分类号：TP391文献标识码：A文章编号：1009-3044(2008)14-20919-03 　　　　1 引言　　　　对于基于内容的图像检索而言，低层视觉特征（如颜色、纹理、形状）与图像的高层语义（如图像描述的主题、对象，表达的情绪等）存在着很大的语义间隔，从高层语义的查询概念到低层图像特征的映射是一个必需完成而又非常困难的问题。而用户又不可能像用检索词表达文本检索的查询概念那样来组织图像特征用以表达图像查询的概念。因此，必需引入相关反馈技术（Relevance Feedback RF）。　　相关反馈是提高系统查询效果的一种强有力的方法，它从用户与查询系统的实际交互过程中进行学习，发现并捕捉用户的实际查询意图，并以此修改系统的查询策略，从而得到与用户实际需求尽可能相吻合的查询结果。相关反馈机制从20世纪90年代中期被引入图像检索中以来，得到了很快的发展[1-3]。从最早的通过移动查询向量和调整特征权值的方法到后来出现的判别式分析方法、密度估计方法、模式分类方法和机器学习的方法等等。其中有一些方法也取得了比较好的效果。RF实际上是可以看成是一个分类问题，因此很多经典的分类算法都可以运用到RF中来。同时，RF分类也存在着自身的特点（问题），主要有以下三个方面：(1)小样本问题；(2)正负样本不对称问题；(3)用户的贪婪性：因此，采用任何一种分类算法来解决RF时必需要考虑到以上三个问题。本文基于以上问题，提出了一种改进的基于受限随机选择和检索结果集[4]的相关反馈技术。受限随机选择的方法很好的解决了反馈中的小样本问题和正负样本不对称的问题，而通过截取检索结果集的方法在一定程度上提高了反馈的效率，更好的适应了用户的贪婪性。　　　　2 SVM相关反馈　　　　支持向量机[5]是最有效的分类技术之一，被广泛地应用到RF中。然而，RF固有的两大问题在经典的SVM中并没有得到很好的考虑和解决。目前，已经有很多人对RF中运用的SVM算法进行改进。本文从RF固有问题出发，提出了自己对利用SVM解决RF问题改进的算法。　　SVM有较强的理论基础和实践经验，对小样本有较好的分类性能，而小样本正是CBIR中RF的一个重要特点，SVM因其通用性和出色的分类能力被广泛地应用到RF中。一个支持向量机就是一个预先定义好了函数形式的函数。训练一个支持向量机需要一个事先标记过的训练样本集,SVM 将会试图使函数符合这些样本。SVM相关反馈基本思想如下：通过用户对提供图像的相关性的标注得到训练样本集，寻找到将给定的属于两个类别（正负样本类）的训练图像分开的最优分类面，然后以图像库做为测试样本，输出正样本类中离超平面最远的图像作为检索结果。本文将SVM方法作为分类器引入。　　SVM的分类思想可描述为通过使各类之间距离最大确定超平面：　　　　3 受限随机选择　　　　在SVM分类中一个非常重要的问题就是训练样本集获取，由于RF中固有的小样本问题，我们最开始获得的训练样本数目非常有限，这会导致分类器不稳定、不可信赖，尽管有的方法通过累积前面反馈过程中的反馈图像扩大训练样本，但是其获取的样本信息量很少，分类性能不佳，用户常常无法忍受。为了有效地解决这个问题，本文提出CRS方法来扩大负样本（不相关图像）的集合，这种方法既避免了随机选择的盲目性，又弥补了训练样本中的负样本类对整个负样本类代表性差的缺点。因为受限随机选择的这些负样本能够比较好地反映图像库中所有的负样本（不相关图像）在特征空间的分布。具体思想如下：　　　　(3)选择范围二次受限：确定好负样本为离正样本类最远的一部分样本并不足够，因为如果单一的在此区域内进行随机选择，显然选择出的负样本对负样本类的代表性还具有一定的盲目性。为了使各个距离程度上的负样本类均会被选择到，即保证在每个相似度层次样本都有分布，将之前确定选择范围再分为L段（等距划分）在此L段上再分别随机选择若干样本。可以认为，基于此思想上选择的负样本较随机选择而言对负样本类具有较好的代表。　　　　4 检索结果集的选取　　　　反馈算法在利用人机交互有效的弥补一次检索准确率不高的缺点的同时，反复的距离计算和比较必然带来检索时间的负担。一般认为用户的耐心是有限的