基于p.d.f特征分层稀疏表示在图像分类中应用.doc

下载文档 降价啦

9
0
约2.46千字
约 4页
2017-06-21 发布于福建
举报
版权申诉
保障服务

基于p.d.f特征分层稀疏表示在图像分类中应用.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于p.d.f特征分层稀疏表示在图像分类中应用

基于p.d.f特征分层稀疏表示在图像分类中应用　　摘要：为了在计算机视觉任务中构造有意义的图像表示，提出一种基于概率密度函数（p.d.f）梯度方向直方图特征的分层稀疏表示方法用于图像分类。传统分层稀疏表示方法利用SIFT描述子或者直接从图像块学习图像表示，通常不具有较强判别性。该文利用具有通用性的p.d.f特征进行分层学习并使用空间金字塔最大池化方式构造图像级稀疏表示。实验结果证明了所提算法的鲁棒性和有效性，在UIUC?Sports，Oxford Flowers，Scene15三类数据集上分别达到87.3%，86.6%，84.1%的分类准确率关键词：图像分类；分层稀疏表示；空间金字塔最大池化；图像表示中图分类号： TN911.73?34； TP391.4 文献标识码： A 文章编号： 1004?373X（2017）10?0095?04 Abstract： In order to construct the meaningful image representation in computer vision task， a novel hierarchical sparse representation method based on oriented histogram feature of probability density function （p.d.f） gradients is proposed for image classification. The traditional hierarchical sparse representation method which learns the image representation with SIFT descriptor or learn it directly from image block has poor discrimination. A universal p.d.f feature is employed for hierarchical learning， and the spatial pyramid max pooling method is used to construct the image?level sparse representation. The experimental results show that the algorithm has robustness and availability， and the classification accuracy for classifying the datasets of UIUC?Sports， Oxford Flowers and Scene 15 can reach up to 87.3%， 86.6% and 84.1% respectively. Keywords： image classification； hierarchical sparse representation； spatial pyramid max pooling； image representation 0 引言图像分类作为计算机视觉中的基本任务被广泛应用于图像检索、网络图像搜索、智能交通系统和生物工程系?y等领域中。其中，获取有效的图像表示则是影响分类性能的关键因素[1]。而分层模型已经逐渐成为可靠的方法用于提取具有判别力的图像表示[2?4]。在分层模型中，图像表示是逐层进行构造的。传统的算法中采用局部图像块或者SIFT描述子进行分层稀疏编码[5?6]，然而所获得的图像表示并不具有较强的判别力，这种局限性直接影响了该模型在多类测试数据集上的性能文献[7]提出了一种全新的方式提取用于分类的图像特征。该方法源于特征袋（Bag of Features，BOF）模型，即首先需要从图像中提取大量的局部描述子；然后将核密度估计用于这些已经获取的局部描述子，从而获得相应的概率密度函数；最后，概率密度函数的梯度方向被编码并同时整合为直方图。从几何观点角度出发，这可以对概率密度函数的形状分布进行有效的表征。值得注意的是利用这种方法获得的图像特征具有通用性，可以广泛应用到众多目标和场景类测试数据集中另一方面，分层学习（Hierarchical Learning）可以让一个由多处理层组成的计算模型通过多个抽象层的学习而获得有意义的数据表示。这个模型通常是由多层非线性的信息处理过程构成的，图像表示的学习过程逐渐地向更抽象的阶段发展[8]。这种更为高效且直接的分层构造方法，能够使得所有来自输入图像的p.d.f特征可以进行独立的稀疏编码。在获得最