基于一种新的特征提取的语音辨识.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第9卷 第2期 2009年 1月 科 学 技 术 与 工 程 Vo1.9 No.2 Jan.2009 1671·1819(2009)2一O46o-05 ScienceTechnologyandEngineering ⑥ 2009 Sci.Tech.Engng. 基于一种新的特征提取的语音辨识 刘 嘉 骆瑞玲 李 明 (兰州理工大学计算机与通信学院,兰州 730050) 摘 要 提出了一种新的二次特征提取的方法应用于说话人语音辨识。首先,通过基于熵的特征筛选方法,有效地剔除不重 要或者噪声特征,消除语音特征的冗余,并获得其重要性排序,减少语音特征矢量的维数。然后,采用Fisher准则进一步进行 参数选择,按 Fisher比的大小选择特征向量作为投影轴,将高维空14中的特征矢量映射到低维的特征判别空间,然后以SVM 作为分类器实现说话人辨识系统。实验结果表明,本文提出的方法在不影响识别率的情况下可以对输入数据有效降维,在噪 音环境下取得了较好的识别效果,增加了系统的鲁棒性。 关键词 说话人识别 基于熵的特征选择 支持向量机 Fisher鉴别准则 中图法分类号 TP391.42; 文献标志码 A 说话人辨识是通过对说话人语音参数的分析 影响很大,并且对分类器的构造也起着非常重要的 来判定待测说话人的语音属于多个参考说话人之 作用。这种情况下,减少特征维数或特征降维就显 中的某一个。它可以应用于声音拨号、电话购物、 得异常重要。再者,如果所提取的特征不能很好地 声控电子密码锁、刑侦破案、机要保密、玩具和家用 反映原始结构信息,那么识别结果依然很差。所以 电器等领域。 在设计分类器时快速、有效的特征提取方法不但能 支持向量机 (SupportVectorMachine,SVM) 够使复杂的问题简单化,而且能够提高分类器的效 是一种基于结构风险最小化的统计学习方法,由于 率。主成分分析 (PCA) 是一种常用的特征提取 它具有泛化能力强、没有局部极小点和解具有稀疏 方法,但 PCA的核心思想是用较少的变量在彼此不 表示等突出优点,已成为机器学习领域的一个研究 相关的前提下尽可能地反映原变量的统计特性,即 热点,在说话人识别中也逐渐得到应用嵋.3J,并取得 保留原模式样本中方差最大的数据分量,故所得到 了很好的效果。 的只是最佳的描述特征而不是最佳鉴别特征;再 对与文本无关的说话人识别而言,提取的语音 者,PCA变换时,类间离散度最大的同时,类内离散 特征矢量中包含很多冗余信息。不同话者之间的 度也增大。 特征矢量在特征空间中有一定的重叠,如果用这些 为了提高SVM的分类速度和精度,本文提出了 特征矢量直接构建识别模型,就会导致训练速度 一 种有效的维约简方法。首先,采用基于熵的特征 慢,存储量以及测试阶段计算量增加。再者,受录 筛选方法 j,对原始特征进行评估,有效剔除不重 音环境的影响,采集到的数据集难免有噪音存在, 要或者噪声特征,从中筛选出最能反映数据分布结 而这些噪音属性会直接影响识别的准确性,从而使 构的特征子集,初步减少语音特征矢量的维数,消 得分类器的性能下降。因此选择合适的特征来

文档评论(0)

在水一方 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档