基于特征维数的图像识别图像识别.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于特征维数的图像识别图像识别 1 变换域与特征形成算法 在图像隐居分析中,图像特征的形成和模式分类是两个主要技术的基础。一组对于隐写行为敏感的特征会简化整个隐写分析过程,还会在很大程度上改善检测效果。为提高隐写检测率,寻找出合理的特征空间是很必要的。 图像特征通常取自于空域和变换域。变换域常选用离散余弦变换(Discrete Cosine Transform,DCT)域、离散小波变换(Discrete Wavelet Transform,DWT)域、离散傅立叶变换(Discrete Fourier Transform,DFT)域。目前,在特征形成算法上并没有很大突破,由于某些特征的检测结果不够理想(如文献的Farid 216维小波域特征),通常改进方法是将空域及变换域特征进行融合,以获得较全面的图像特征,取得更好的检测效果。 为分析特征维数对分类器设计及隐写检测率的影响,对比人工选取与机器降维2种降维方式的隐写图像识别率,本文设计了3组对比实验,验证了低维特征更有利于简化分类器设计、降低计算复杂度和提高隐写检测正确率。 2 实验设计 2.1 实验数据的描述 2.2 组特征维数检测正确率的比较 为分析特征维数对分类器设计与隐写检测率的影响,本文设计了3组对比实验。实验依据文献,分别形成小波域216维特征、DCT域252维特征及空域387维特征。 实验1将三组特征各自的检测率与三者融合后855维特征的检测率进行比较,以此检验4组图像特征融合后形成的高维特征是否会提高隐写检测正确率,结果如表1所示。 实验2以216维小波域特征为基点将特征维数不断增加,对比不同维数特征的检测率,分析特征维数对隐写检测率的影响。首先,将216维小波域特征与252维DCT域特征相加得到468维特征。其次,将468维特征加上387维空域特征得到855维特征。对3组不同维数特征的检测结果进行比较,以此分析特征维数的不断增加是否会使隐写检测正确率持续升高,实验结果如表2所示。 从表2可以看出,3组特征的检测率总体上呈先上升后下降趋势,说明在一定范围内增加特征维数会使检测率升高,而超过某一个临界点后继续增加特征维数反而会造成检测率下降。 若对一组n个d维样本进行分类,Fisher线性判别分类器的复杂度为O(d2n)。由此可见,维数的少量增加会对计算复杂度产生很大影响,高维特征使在海量正常数字媒体中快速检测出隐写图像变得更加困难。由实验2可知,为在隐写检测率与计算复杂度之间达到平衡,适当增加特征维数会获取更为全面的图像特征,使隐写检测率有所提高。但当特征维数增加到某一个临界点后,继续增加不仅会造成计算复杂及维数灾难问题,而且过高的特征维数会使噪声对于分类器的负面影响更加明显,噪声过大,可能使随后的分类算法产生错误的几何投影,对原本拥有较好检测效果的训练集产生干扰,导致隐写检测率下降。 高维特征的以下性质也会导致隐写检测率的下降:(1)维数的增加使得包含数据的单元数目急剧下降,空的单元数目迅猛增加,导致样本数相对变少,造成高维空间数据分布的稀疏性,使得某些统计上的渐近性质受到破坏。(2)高维数据可能导致空空间现象,所谓空空间现象是指在高维空间的空区域中点的密度可能会很高。(3)在高维空间中可能出现正态分布的胖尾现象。当一维随机变量服从正态分布时,其落入正态分布概率密度函数曲线图两端的尾部是小概率事件,而当维数增加时,数据表现出拖尾现象,数据落入尾部不一定是小概率事件,不能轻易忽略。高维数据的这些性质导致分类器对其进行处理时出现问题,影响隐写检测正确率。 2.3 检测结果分析 为避免高维数据产生的维数灾难问题,简化分类器的设计,需要确定合理的特征维数。人工选取与机器降维是实现高维数据维数约简的2种方式。 实验3对人工选取特征与机器降维后特征的检测效果进行了对比,分析了2种降维方式的优劣,实验结果如表3所示。第1组人工选取的360维特征由252维DCT域特征与108维小波域特征组成。由于在DCT域提取JPEG图像特征最为适宜,而且利用小波线性预测模型的偏度、峰度形成特征的检测效果较均值、方差更为理想,因此本文选取这2种方法进行结合,以形成人工选取的360维特征。第2组360维特征由LLE(Locally Linear Embedding)降维算法对855维特征降维后形成。LLE降维算法既有非线性的特点,又有线性方法的优点,能够使降维后的数据保持原有的拓扑结构。 在Matlab7.0下随机选择1 000幅Jsteg隐写图像,使用LLE降维算法(K=8)进行机器降维,降维前后特征分别如图1(a)、图1(b)所示。 从图1可以看出,特征降维前后特征维方差有明显改变。图1(a)中特征能量分布不均且存在较大冗余,不利于产生正确的分类结果。由图1(b)可以看出,LLE降维处理降

文档评论(0)

186****6619 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档