基于PCA-MFCC支持向量机快速语音识别.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于PCA-MFCC支持向量机快速语音识别.pdf

No.4Feb.2013 第13卷第4期2013年2月 科学技术与工程 V01.13 Science and ⑥2013Sci.Tech.Engrg. 1671—1815(2013)04—1034—04 TechnologyEngineering 庞陟儒1 张雪英1 刘晓峰2 (太原理工大学信息工程学院1和数学学院2,太原030024) 摘要针对大规模数据集下支持向量机(SVM)训练耗时长的缺陷,以及支持向量机中核函数维数过高,采用了主成分分析 法对语音特征降维,减少了核函数的阶数,降低计算复杂度,进而缩短训练模型所用时间。实验证明,该方法不仅能够缩短训 练时间,而且能通过控制贡献度来保持识别率不下降。 关键词支持向量机 reel倒谱频率系数 主成分分析 语音识别 中图法分类号TN912.34 文献标志码A 语音识别技术是人机交互的基础,随着计算机 {+1,一1}的两类之一。训练SVM就是要在特征 科学技术的发展,语音识别技术取得显著进步并逐 空间中,寻找能将两类样本正确分开的最优分类超 渐开始从实验室走向市场。支持向量机¨’2o作为一 平面WX+b=0,并使得离平面最近的每类点(称为 Vector)与该平面的距离达到最大 种新型的模式识别方法,是建立在统计学习理论的 支持向量,Support VC维理论和结构风险最小原理基础上的,已经成 值。样本到超平面的距离可定义为1川Wl|。当 功的运用到语音识别中,但是随着语音识别系统规 ||W||最小时,分类间隔最大,此时的分离超平面即 模的增加,支持向量机算法复杂度随着所求解二次 为最优分类面。最大化分类间隔实际上就是对泛 化能力的控制心],统计学理论表明最优分类面具有 规划问题QP(quadraticprogramming)规模的增大呈 指数增长,并且计算量大、训练速度慢,其不适宜大 最好的泛化能力。 当训练样本集为线性近似可分时,需引入非负 规模数据问题的应用,已成为影响支持向量机发展 的主要因素。 松弛变量fi≥0,i=1,…,f,上述最优分类超平面 的求解问题变为: 在语音识别中,提取到的语音特征维数比较 l 1 高,对大词汇量的语音使用支持向量机进行训练 P寺1|训nc酗 (1) 时,训练时间比较长,实时性较差,不便于应用。针 o s.¨t Y。(W·X。+b)≥1一f。 对所用语音特征维数高的缺陷,在识别前对语音特 式(1)中,C称为惩罚参数且C0,C越大表示对 征进行预处理,将语音特征维数降低,以减少训练 错误分类的惩罚越大。引入Lagrange乘子法可以 所需时间。 将上述最优化问题转化为一个二次规划对偶问 1支持向量机 题,即

文档评论(0)

文档精品 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档