噪音环境下的语音识别研究概述 .pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(又称听写机,它能把语音转换为文字)、语音翻译

机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的

研究工作了。

计算机语音识别的最终目标是使计算机能够听懂人的语言。尽管语音识别的研

究历史最早可以追溯到二十世纪50年代初,但是直到60年代中期以后才作为一个

重要的课题展开工作,并且逐步取得实质性的进展。这有两方面的原因,一方面计算

机产业的迅速发展提出了使用要求,同时软、硬件环境的改善为复杂算法的实现提

供了好的环境;另一方面,数字信号处理的理论和算法已有相当基础。许多算法诸

如快速傅里叶变换、倒谱计算、线性预测算法、数字滤波器等已经出现,语音信

号特有的基音周期、共振峰等特征的提取算法也出现了。识别系统使用方式逐渐从

特定人、孤立词、小词表方式发展到非特定人、连续语音、大词表方式。近十年

来,语音识别的产品也逐渐多起来,例如Motorola的语音拨号电话、IBM的语音听

写机等。但是,现有的语音识别系统都存在一个共同的问题,即性能不稳定。不同

的用户、不同的信道、不同的背景噪音环境、不同的口音和发音方式都对识别性能有

很大的影响。最近十多年来抗噪语音识别方法形成了高潮,因此,提高语音识别系

统对噪音的鲁棒性,是今后语音识别研究的一个重点。

1三种典型的去噪处理方法我们可以将各种抗噪方法粗略可以分为信号级抗噪处理方

法、特征参数级抗噪处理方法、模型级抗噪处理方法。后两种方法有些交叉。下面

逐一进行讨论。

信号级抗噪处理这种处理是从带噪语音信号中提取

尽可能纯净的原始语音,在语音信号处理中称为语音增强。语音增强技术在语音通

讯、语音识别中有都有应用。在实际应用推动下,早在60年代语音增强这个课题

就已引起了人们的注意,70年代形成一个高潮,取得了一些基础性成果。由于噪声

来源众多,并随应用场合而异,它们的特性也各不相同,因此,即便是在实验室仿

真条件下,也难以找到一种通用的、能适用于各种噪声环境的语音增强算法。这就

表明:必须针对不同噪声,采取不同的语音增强对策。文论述了如下一些语音增

强方法:LPC全极点模型增强算法、最大后验概率估计法、卡尔墁滤波法、维纳

滤波法、谱减法及其改进形式、最小均方误差估计。则分别对噪音同化法、子波

消噪算法、小波单阈值消噪算法、小波频带阈值消噪算法、使用心理声学准则的

残余噪声抑制法进行了论述。在上述方法中,谱减法是语音增强领域中用得最广泛

的方法之一,但它也有明显的缺点,即信号在去噪处理后将带有明显的音乐噪声。

利用心理声学原理给出了适用于各种语音增强方法后处理的残余噪声抑制法。微软

公司曾将干净语音的数据加上各种噪声后做语音增强,然后再进行特征参数提取、训

练模型参数,而在识别时,先进行语音增强处理,然后再进行识别。这种方法的特

别之处在于:噪音是人为地加入到训练用的干净语音中的。因此,我们可以将这种

方法视为一种“反语音增强”的去噪识别方法。按微软公司的报告,这种方法对噪

音有很好的鲁棒性。针对汽车噪音,我们的实验表明,小波频带阈值消噪算法的去

噪效果在听觉和端点信息保留方面具有一定的优势,其效果要明显好于前面提到的

噪音同化法、均值滤波法、谱减法等各种方法。小波频带阈值消噪算法的具体步骤

如下:(1)对原始语音数据做N-1次小波变换,得到N个频带的小波系数。

(2)认为原始语音的前0.1秒是纯噪音,并根据这些噪音数据在各频带上的小波系

数,给出频带各自的噪音最大值的估计M(i),i=0,,,N-1。其中,i是频带标号。

(3)设定相对阈值K,令每个频带的阈值D(i)=K*M(i),i=O,,,N-1。

(4)对各频带小波系数x(j)进行软滤波:x(j)=sgn(x(j))*Max{abs(x(j))-D(i),O}。

其中j是小波系数的下标。

(5)对新小波系数进行N-1次相应的反小波变换,得到语音增强信号。特征参数

级抗噪处理目前绝大多数识别系统使用倒频谱类特征参数,例如LPC-CEP,MEL-

CEP,FFT-CE等,大量的实验表明,这些特征参数对环境噪音的鲁棒性并不好。可以

将特征参数级抗噪处理方法分为三类

文档评论(0)

183****3622 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档