- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014年 第七届国际图像与信号处理一种通过离散余弦变换实现快速场景分类的方法
Ce Li1,2, Ming Li1, Meili Xiao1 Zhijia Hu1, Xiuxun Miao1, Zhengrong Pan1
1.电气与信息工程学院 2.工智能与机器人研究所
兰州理工大学 西安交通大学
兰州730050,中国 西安710049,中国
摘要—场景分类是计算机视觉中一个热点问题。在本文中,提出了一种基于离散余弦变换(DCT)域的新的快速场景分类方法。首先,我们将整个图像无重复地分割成同样大小的几个区域,在分成的B * B的每个子图像区域进行DCT变换。其次,通过三种方法扫描每个DCT块上的AC系数。在DCT块中提取的特征向量,基于AC系数的相关性建模。最后,用之前得到的特征向量,使用一对支持向量机的训练分类器。实验结果表明,所提出的方法是有效的图像分类。
索引词汇—场景分类;离散余弦变换;方向性;多分辨率;压缩域。
I.引言
面对巨大的图像数据量,用传统的方法,如人工分类和标签变得不切实际。如何使计算机自动在不同的场景使用图像分类和标签,在计算机视觉领域中是一个非常重要的研究课题。
场景分类的目的是试图建立低层次的特征描述和高层知识之间的关系,识别和解释场景的语义范畴。
场景分类的方法主要包括两大类别。一种是直接提取低级别的特征,是利用底层特征到高层信息映射过程。根据特征值的不同来源,这种分类方法可以分为全局特征和局部特征提取。全局特征主要包括vailaya的[ 1 ]的层次分类方法。是基于局部特征提取的分类方法第一次提出了szununer?[ 2 ],它没有独立的图像子块分类,使用多数表决分类器获得最终的结果,将图像分为室内和室外场景。
另一种方法是基于中间模型的特点,这是建立低、中、高级分别对场景图像的语义表示。这种方法也可以分为两类。一种是基于在视觉词汇包[ 3 ],[ 4 ]。评价要点图像中的第一个,然后定量局部描述表在关键点获得的视觉码表,统计图像视觉单词(直方图)的发生频率,
最终建立图像的状态包。第二方法是基于中间语义。奥利瓦等人。[ 5 ]使报表的场景的内容结合全局和局部图像场景的属性。描述从一组几个滤波器的输出能量的计算机。过滤Gabor滤波器调谐到8个在4个不同的尺度。滤波器对输出每个4 ? 4网格进行平均,。最后使用一种基于这些场景图像神经网络分类状态。
现有的图像分类方法都是针对未压缩图像。然而,大多数互联网上的图像通常存储在压缩域如JPEG。由于JPEG图像可以减少存储空间和大大提高下载速度,被广泛应用于网络图像。因此,建立一个可以应用到压缩域场景分类模型是非常必要的。
为了提高分类系统的速度,我们提出了一种基于离散余弦变换(DCT)场景分类方法,它具有以下新的内容:1)可以大大的提高提取其高速的分类系统DCT系数其性能作为场景分类的特征向量。II)可用于在不完全解码的DCT编码图像数据的DCT压缩域。,图像从压缩域特征向量可以得到直接。
本文的其余部分组织如下。在第二部分所展现的是场景分类方法的细节描述。第三部分中给出了实验结果。最后的一部分是论文的结论。
II.场景分类模型
“Z”型扫描
建立的子图像块
I
建立的子图像块
II
SVM分类器
微分向量
特征向量
D
C
T变换
原始图像
水平扫描
微分向量
垂直扫描
微分向量
图1:流程框架
在本文中,提出的场景分类方法实施过程主要分为以下四步骤:i)将整个图像划分为无重复的同样大小的几个区域,用公式B * B(B = i * 8 ,i = 1,2······)在每个单独的子图像区域上做DCT变换;II)通过“Z”型、水平和垂直三种方式扫描每个DCT块的AC系数,基于DCT块和AC系数之间的相关性建模;III)通过第二步从DCT系数中提取特征向量;IV)用得到的特征向量,使用一个对多训练支持向量机分类器得到最终的分类结果。该场景的框架分类模型如图1所示。
二维DCT变换
相应的二维逆DCT变换定义为:
此处:
F(u,v)表示的是DCT变换后的矩阵系数,f(i,j)表示的是DCT变换前的系数,(u,v),(i,j)是坐标矩阵系数。
基于DCT系数的特征提取
图2:在8X8的DCT块中DC,MF,HF的分布
在现有的工程[ 7 ],[ 8 ]表明,DCT系数具有多分辨特性。DCT系数的分布如图2所示。在图2从左上角到右下角不同地区的颜色对应的低频(LF),中频(MF),高频(HF)的DCT系数分别为[ 9 ],[ 10 ]。在8?8块的63个DCT系数,由一个直流系数和交流系数组成。前
文档评论(0)