基于图像场景的新的主题特征的分类.docVIP

下载本文档

3
0
约7.4千字
约 12页
2017-02-11 发布于重庆
举报
版权申诉

基于图像场景的新的主题特征的分类.doc

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于图像场景的新的主题特征的分类

　　　　　　基于图像场景分类的新的主题特征摘要：我们提出了基于图像场景分类的新的主题特征。这个特征是由主题构建的图像表示的。即LDA的潜变量(潜伏狄利克雷分配)及其学习算法。与其它相关文献不同的是，在文章中所定义的特性共享不同类别下的主题,甚至在分类之前不需要类标签,以至于就可以避免特征和标签之间的耦合特性。为了表示一个新的图象,我们直接提取主题特征变量通过码字线性映射的方法,而不是潜变量的推理。我们将我们的方法与其他三个主题模型在类似的实验条件下进行比较，同时合并这些方法应用于15个场景数据集对象。结果表明,我们的方法可以很精确的分类场景类并且精度高于其他主题模型而且不使用空间信息。我们发现性能改善是由于被推荐的特性以及我们的算法,而不是其他因素,如额外低层图像特征和更强的预处理。关键词：图像场景分类、主题特征、LDA模型、吉布斯采样器前言：图像场景分类是在计算机视觉和机器学习一个非常重要的问题。自动的获取图像语义信息变得不可或缺,并且已经广泛应用于许多实际的信息系统。然而,场景分类面临着许多挑战，列如可变性,歧义性,广泛的照明范围[1]。目前,三个典型的方法可以在图像场景分类的任务中被找到。第一个方法考虑图像作为单独对象可以直接将他们通过如颜色、纹理和功率谱等低级特征进行分类,。这种方法通常用于一小部分场景类别[2]。第二个方法采用图像的高级特征,这个方法认为图像是图像点的集合这个方法和基于这一策略的很多方法具有优良性能(3 - 5)。最后一个方法采用由潜在的变量所构造的主题模型，它根据中间语义分类图像。这种方法被应用于包含更多场景类别的情况。它认为一个图像不仅是图像点的集合[6、7],同时也是一个更复杂的结构(8、9),它包含丰富的图像信息和接近人类看图像的方式，因此这种方法得到了越来越多研究团体的关注。典型的主题模型是概率潜在语义分析(PLSA)[10]和潜在狄利克雷分配(LDA)[11]。虽然主题模型最初产生于文本处理,近年来它已广泛应用于计算机视觉领域。例如,在[6]提出的图像分类方法可以训练一个适用于每个类别的LDA模型和使用贝叶斯决策识别图像标签。此外,在[7]中提出了基于sLDA(监督式LDA)的图像分类和标注的联合模型。这些方法可以分配图像的标签通过推理图像的中间变量,因此通常不需要额外的分类器。与前面的一些方法不同的是,主题模型与监督分类器相结合,然而,这些监督模型[6、7]不能利用一些现有的在图像分类方面方法，譬如普遍的监督式分类和特征处理。特别的是，很难从这些模型中提取特征向量,所以不能轻易把主题信息与其他功能结合起来,就像在[12]所提到的。另一方面,那些早期的方法分类精确度低于这些新的,因为它们对于图像的表现是不适当的。因此,本文的目标不仅只是考虑到后者的优点而且也是为了获得更高的分类精度。在本文中,我们提出一个新颖的关于图像场景分类的主题功能，这个主体功能是基于对boW的假设。我们首先用LDA建立一个图像主题模型,然后提取主题功能，这些主体功能基于进行进一步分类的主题模型。不同于那些在(6,1)的方法,我们的方法不需要分别对每个场景类建立一个主题模型。相反,它描述了在相同的潜在主题空间中所有的场景图像(类似于[7])。因此,我们的方法可以完全忽略场景类别信息在主题功能输入到监督分类器之前。与其他主题模型方法相比,我们的方法在特征提取过程中不需要推理,所以它可以降低主题模型的计算复杂性。此外,它有更少的计算量与池方法相比,因为我们的方法需要较小量的码字,避免了大量对于SIFT算子和码字的计算。同时,该方法可以提高图像场景分类的精准度。论文的主要工作包括: 提出一个图像主题描述,它允许主题特征可以快速被提取通过码本的线性映射。定义了表示的图像的主题特征，该特征表示了图像的场景环境信息（通过其尺寸可以灵活调整的特征向量），这使得图像可以根据场景进行现成的监督分类被提出的主题功能在特征提取上具有非常低的计算复杂度,这样很容易于场景分类的其他功能进行结合，在第2部分中,我们介绍我们的模型和算法。在第三中,我们描述了相关的工作。数据集实验和研究的结果在第四节。在第5部分中,我们讨论我们的结果和总结研究结果。最后我们在第六节总结本文。 2 算法和模型我们的算法是图1所示。我们图像。一个完整的形成。每张图片。测试,图像首先使用相同的,然后相关的特征向量在特征空间类似的。最后,测试集他们的特征向量训练分类器进行分类。在本节中,我们将介绍我们线性映射,我们讨论所有其他步骤2.1节、2.3节。 2.3。参数估计:吉布斯采样器 LDA模型的参数估计方法中：拉普拉斯近似[17],变分推理[18]和马尔可夫链蒙特卡罗(采样)[19]。吉布斯抽样是MCM