一种通过离散余弦变换实现快速场景分类的方法剖析.docx

一种通过离散余弦变换实现快速场景分类的方法剖析.docx

一种通过离散余弦变换实现快速场景分类的方法剖析

2014年 第七届国际图像与信号处理一种通过离散余弦变换实现快速场景分类的方法Ce Li1,2, Ming Li1, Meili Xiao1Zhijia Hu1, Xiuxun Miao1, Zhengrong Pan11.电气与信息工程学院2.工智能与机器人研究所兰州理工大学西安交通大学兰州730050,中国西安710049,中国摘要—场景分类是计算机视觉中一个热点问题。在本文中,提出了一种基于离散余弦变换(DCT)域的新的快速场景分类方法。首先,我们将整个图像无重复地分割成同样大小的几个区域,在分成的B * B的每个子图像区域进行DCT变换。其次,通过三种方法扫描每个DCT块上的AC系数。在DCT块中提取的特征向量,基于AC系数的相关性建模。最后,用之前得到的特征向量,使用一对支持向量机的训练分类器。实验结果表明,所提出的方法是有效的图像分类。索引词汇—场景分类;离散余弦变换;方向性;多分辨率;压缩域。I.引言面对巨大的图像数据量,用传统的方法,如人工分类和标签变得不切实际。如何使计算机自动在不同的场景使用图像分类和标签,在计算机视觉领域中是一个非常重要的研究课题。场景分类的目的是试图建立低层次的特征描述和高层知识之间的关系,识别和解释场景的语义范畴。场景分类的方法主要包括两大类别。一种是直接提取低级别的特征,是利用底层特征到高层信息映射过程。根据特征值的不同来源,这种分类方法可以分为全局特征和局部特征提取。全局特征主要包括vailaya的[ 1 ]的层次分类方法。是基于局部特征提取的分类方法第一次提出了szununer?[ 2 ],它没有独立的图像子块分类,使用多数表决分类器获得最终的结果,将图像分为室内和室外场景。另一种方法是基于中间模型的特点,这是建立低、中、高级分别对场景图像的语义表示。这种方法也可以分为两类。一种是基于在视觉词汇包[ 3 ],[ 4 ]。评价要点图像中的第一个,然后定量局部描述表在关键点获得的视觉码表,统计图像视觉单词(直方图)的发生频率,最终建立图像的状态包。第二方法是基于中间语义。奥利瓦等人。[ 5 ]使报表的场景的内容结合全局和局部图像场景的属性。描述从一组几个滤波器的输出能量的计算机。过滤Gabor滤波器调谐到8个在4个不同的尺度。滤波器对输出每个4? 4网格进行平均,。最后使用一种基于这些场景图像神经网络分类状态。现有的图像分类方法都是针对未压缩图像。然而,大多数互联网上的图像通常存储在压缩域如JPEG。由于JPEG图像可以减少存储空间和大大提高下载速度,被广泛应用于网络图像。因此,建立一个可以应用到压缩域场景分类模型是非常必要的。为了提高分类系统的速度,我们提出了一种基于离散余弦变换(DCT)场景分类方法,它具有以下新的内容:1)可以大大的提高提取其高速的分类系统DCT系数其性能作为场景分类的特征向量。II)可用于在不完全解码的DCT编码图像数据的DCT压缩域。,图像从压缩域特征向量可以得到直接。本文的其余部分组织如下。在第二部分所展现的是场景分类方法的细节描述。第三部分中给出了实验结果。最后的一部分是论文的结论。II.场景分类模型图1:流程框架在本文中,提出的场景分类方法实施过程主要分为以下四步骤:i)将整个图像划分为无重复的同样大小的几个区域,用公式B * B(B = i * 8 ,i = 1,2······)在每个单独的子图像区域上做DCT变换;II)通过“Z”型、水平和垂直三种方式扫描每个DCT块的AC系数,基于DCT块和AC系数之间的相关性建模;III)通过第二步从DCT系数中提取特征向量;IV)用得到的特征向量,使用一个对多训练支持向量机分类器得到最终的分类结果。该场景的框架分类模型如图1所示。二维DCT变换相应的二维逆DCT变换定义为:此处:F(u,v)表示的是DCT变换后的矩阵系数,f(i,j)表示的是DCT变换前的系数,(u,v),(i,j)是坐标矩阵系数。基于DCT系数的特征提取图2:在8X8的DCT块中DC,MF,HF的分布在现有的工程[ 7 ],[ 8 ]表明,DCT系数具有多分辨特性。DCT系数的分布如图2所示。在图2从左上角到右下角不同地区的颜色对应的低频(LF),中频(MF),高频(HF)的DCT系数分别为[ 9 ],[ 10 ]。在8?8块的63个DCT系数,由一个直流系数和交流系数组成。前几个低频系数包括大部分的能量,它们表示背景,图像轮廓。在DCT系数量化的过程中高频系数被忽略,因为他们几乎接近于零。在本文中,场景分类的特征向量是通过DCT块矢量中的AC系数差异获得的,目的是计算出矢量差获得[11], [12]的相关系数。场景分类模型所提出的方法的特征提取过程可以概括为:a)全局图像块:将整个图像分为M*M个大小相同且不重复的块,其中M=2i ,i=

文档评论(0)

1亿VIP精品文档

相关文档