- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于改进PSCO―SVM的多生物特征融合技术的研究.doc
基于改进PSCO―SVM的多生物特征融合技术的研究
摘 要:为了解决单通道生物特征识别的缺陷,在信息融合的基础上提出了一种基于人脸和语音融合的生物特征识别模型,实现了特征层的融合。对人脸图像采用主成分分析法(PCA)进行特征提取,对说话人采用fisher判别进行特征维数的约简。同时,提出一种基于PSO的多粒子群协调优化(PSCO)方法,并将其用于训练SVM来实现人脸和语音的混合认证系统,实验结果表明该方法取得了较好的识别效果。
关键词:支持向量机;粒子群优化算法;人脸识别;语音;特征层融合
中图分类号:TP391
单一模态的生物特征识别技术容易受到噪声的影响和单一算法自身稳定性的影响,很难保证在取得较高识别率的同时保持高的鲁棒性。多生物特征的识别技术同时采用多种生物特征作为识别依据,使得身份识别系统具有更好的安全性、可靠性和有效性,为解决单一模态生物特征识别的缺陷提供了较好的解决方案[1]。在这种情况下,多生物特征认证已经成为国内外的研究热点。
SVM是统计学理论的一个分支,在解决小样本,高维数及非线性问题中表现出特有的优势。已经被成功的运用模式识别的各个领域,在多生物特征识别中也得到应用[2]。但SVM本质上求解二次规划问题,当训练样本数很多的时候,可能会导致训练速度变慢。粒子群优化算法(PSO)[3]是一种群聚性智能优化算法,由于其出色的表现和很好的收敛性越来越受到人们的关注,许多学者从不同的角度对算法进行了改进。文献[4]和文献[5]从不同角度提出了多粒子群协同进化算法,使粒子更容易跳出局部极小值,提高了收敛精度。然而,粒子群的中心位置是一个非常重要的位置,随着粒子的进化,所有粒子都向该方向收缩,中心粒子更有可能成为全局最优解[6]。为此,在文献[5]的基础上本文提出一种改进的多粒子群协同进化(PSCO)方法,并将其用于训练SVM来实现人脸和语音特征层融合的多生物特征识别系统,取得了较好的识别效果。
1 基于PCA的人脸识别方法
主成分分析(Principal Component Analysis,PCA)[7],是统计学中数据分析的一种方法,其目的是在最小均方意义下寻找最能代表原始数据的投影方向,来获得逼近原图像空间的最低识别空间。基于PCA的人脸识别算法一般分为三个阶段:第一个阶段利用训练样本图像数据构建特征脸空间;第二个阶段是训练阶段,主要是将训练样本图像投影到特征脸空间上;最后一个阶段是人脸识别阶段,即将待识别的人脸图像投影到特征脸空间,并且和投影后的训练样本图像相比较,得到识别结果[8]。
假设人脸图像I(x,y)是大小为M×N的灰度图像,将其每列相连组成一个大小为维的列向量D=M×N。人脸图像向量的维数就是D,图像空间的维数也是D。在人脸识别问题中,通过将2维人脸灰度矩阵的各行级联起来,可以得到一个1维的长向量[9]。
设p个原始观测指标向量x=(x1,x2,…xp)T,给定的一个样本x=(xi1,xi2,…xip)T,i=1,2,…n,则样本数据的协方差矩阵为:
(1)
其中,μ为这组随机向量的均值矢量,近似
表示为: (2)
计算协方差矩阵Cx的特征值,将前n个特征值从大到小的顺序排序,λ1≥λ2≥…λn,对应的特征矢量为:w1,w2,…,w,则存在正交矩阵A使得ATCxA=Λ。其中,Λ=diag(λ1,λ2,…λn)为对称矩阵。由PCA变换定义得:Y(i)=WTX`(i),重构特征向量X`=WTY(i),则X`为该图像在特征空间中投影得到的新图像向量,有n维大小,且保留了原始图像的绝大部分信息。
2 基于fisher鉴别准语音特征提取[10]
对说话人识别来说,受录音环境的影响,采集到的数据集难免有噪音存在,而这些噪音属性会直接影响识别的准确性,从而使得分类器的性能下降。另外一方面,特征矢量在特征空间中有一定的重叠,识别过程中如果所提取的特征包含过多的语义信息,就不能很好地反映原始结构信息,识别结果很差。
Fisher鉴别分析其核心思想是从高维空间中提取最具有分类能力的低维空间,并使得类间离散度最大且保证类内离散度最小。给定一个数据集{xi},i=1,2……N将其分为c类,类内离散度和类间离散度分别定义为:
(3)
(4)
其中,
上式中,xik表示第i类中的第k个训练样本,li表示第i类的样本数,则有 ,表示所有训练样本的均值,第i类样本的均值。定义St=SB+SW,St为总体散度矩阵。则Fisher准则函数定义为:
(5)
问题转化为找到一个最佳投影方向ω,使得F(ω)取得最大值。引入lagrange函数:
L(ω,λ)=ωTSBω-λ(ωTSWω-ξ)
原创力文档


文档评论(0)