语音识别系统的抗噪性处理及性能分析.pdfVIP

语音识别系统的抗噪性处理及性能分析.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音识别系统的抗噪性处理及性能分析.pdf

语音识别系统的抗噪性处理及性能分析 王文为 山东大学信息工程学院 tom E-mail:wwcnwcn888@163 摘要:本文重点研究语音识别系统中信号的抗噪性前端处理方法.将线性预测(LP)分析与形态滤波结台 作为语音识别的前端处理方法,并选用具有抗噪性的MFCC特征参数.将.I-述方法应用于基于HMM的孤 立词识别系统中.结合使用NOISEX.92提供的四种噪声进行测试.结果证明系统抗噪性樽刘r提高. 关键词:语音识别。抗噪性,数学形态滤波.线性预测分析 1引言 随着计算技术的发展。以及比经典HMM模型更精确的DDBHMM等数学模型的提出 【5】。汉语语音识别有了长足的进步。目前,基于HMM的语音识别系统是该领域研究的主 流,其对纯净语音的识别可以达到很到的精度。但是背景噪声对语音特征的影响以及模型参 数的失配,使得系统在噪声环境中的性能恶化。因此.前端的消噪过程显得十分重要。将语 音增强作为一种预处理手段,能有效解决噪声污染。 目前.有六种噪声背景下与说话人有关的孤立词识别方法,它们是:线形预测误差法. 单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法.特征综合 法和同模极点增加法。这六种方法都有效地提高了噪声环境中语音识别率【4】。 本文对噪声环境下的语音识别系统的抗噪性处理进行了探讨。采用线性预测分析和数学 形态滤波对原始语音进行语音增强。作为语音识别的前端处理。在此基础上进行特征提取。 对训练用语音以及测试用语音进行相同的预处理及特征提取,并在特定人、小词汇量和孤立 词识别条件下进行了实验。在相同的实验环境下与基线系统的性能进行比较,结果表明,采 用该方法后,系统对干净语音及带噪语音的识别率均有提高,当信噪比不低下15dB时识别 率提高了12.2%。 2.使用LPC的谱估计 线性预测分析常采用自回归时域模型或全极点频谱模型.线性预测模型能够有效地建模共振 峰,其逆滤波器能够从语音信号中去除共振峰信息以跟踪声调信息。线性预测分析具有高效的计 算方法。因此线性预测分析广泛用于语音编码中,也常在语音识别中用于计算语音特征。 一个P阶LPC模型的传递函数为: 日 专。 一50l一 其中·口,是线性预测系数,口o=l。选择合适的线性预测阶数p,该模型频率响应的幅 度谱就是对语音信号频谱包络的估计。 LPC分析的全极点性质能够精确地估计语音信号的谱峰。但是精确度受信号类型的影 响很大.对符合全极点模型的语音来说精度很高,但对于鼻音和不少辅音来说,LPC对谱 峰带宽的估计一般都超限了。 3.数学形态滤波 数学形态学是一种应用于图像处理和模式识别领域的新方法.通过对目标影象的形态变 换来实现结构分析和特征提取。 信号的数学形态变换遥常涉及被处理信号和所采用的结构元素,其中,结构元素的形状 和取值将直接影响变换的结果。就被处理信号而言,数学形态变换可分为二值形态变换和灰 度形态变换。灰度形态变换是一种极值运算,其对象是多值信号。最基本的灰度形态变换有 形态和(膨胀)、形态差(腐蚀)。 在数字信号处理领域中,数学形态学主要用于非线性变换,井基于集合理论来研究图像, 提供了非常有效的非线性滤波技术。该技术只取决于基元的局部形状特征,因此比传统的线 性滤波更为有效。它可以局部地修改基元的几何特征,并提供有关基元的几何特征信息.因 此这种非线性的滤波器能够有效地消除噪声而保留原基元的一些必要形状特征。 3.1离散形态变换 语音信号处理的是数字信号,因此需要将数学形态学定义到数字空间。建立在数字空间 的离散形态变换是构造数字形态滤波器的基础。对一维语音信号的处理采用函数.集合问的 离散灰度形态变换。 设,G)为定义在z”上的离散函数,即:f:z”一z,结构元素B为z”上的有限子 集,即口[z“.B关于原点的对称集合为占={_6:6∈曰),B关于点x的平移集合为 Bb】=b+x:6∈占,x∈z”},则,G)关于B的基本形态变换定义如下; 腐蚀: ∽啪=嘶掷)}

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档