噪音环境下的语音识别研究概述.docVIP

下载本文档

4
0
约4.39千字
约 4页
2017-08-28 发布于重庆
举报
版权申诉

噪音环境下的语音识别研究概述.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

噪音环境下的语音识别研究概述

噪音环境下的语音识别摘要：语音信号数字处理技术在国民经济、日常生活和军事领域有着极为重要的应用价值和极其广阔的应用空间。本文介绍了语音信号处理在信息科学中的作用以及应用于科学领域的技术。关键词：语音信号，，应用众所周知，语音在人类社会中起了非常重要的作用。在现代信息社会中，小至人们的日常生活，大到国家大事、世界新闻、社会舆论和各种重要会议，都离不开语言和文字。近年来，普通电话、移动电话和互联网已经普及到家庭。在这些先进的工具中，语音信号处理中的语音编码和语音合成就有很大贡献。再进一步，可以预料到的口呼打字机(又称听写机，它能把语音转换为文字)、语音翻译机(例如输入为汉语，输出为英语，或者相反)，已经不是梦想而是提到日程上的研究工作了。50 年代初，但是直到60 年代中期以后才作为一个重要的课题展开工作，并且逐步取得实质性的进展。这有两方面的原因，一方面计算机产业的迅速发展提出了使用要求，同时软、硬件环境的改善为复杂算法的实现提供了好的环境；另一方面，数字信号处理的理论和算法已有相当基础。许多算法诸如快速傅里叶变换、倒谱计算、线性预测算法、数字滤波器等已经出现，语音信号特有的基音周期、共振峰等特征的提取算法也出现了。识别系统使用方式逐渐从特定人、孤立词、小词表方式发展到非特定人、连续语音、大词表方式。近十年来，语音识别的产品也逐渐多起来，例如Motorola 的语音拨号电话、IBM 的语音听写机等。但是，现有的语音识别系统都存在一个共同的问题，即性能不稳定。不同的用户、不同的信道、不同的背景噪音环境、不同的口音和发音方式都对识别性能有很大的影响。最近十多年来抗噪语音识别方法形成了高潮，因此，提高语音识别系统对噪音的鲁棒性，是今后语音识别研究的一个重点。 1 三种典型的去噪处理方法我们可以将各种抗噪方法粗略可以分为信号级抗噪处理方法、特征参数级抗噪处理方法、模型级抗噪处理方法。后两种方法有些交叉。下面逐一进行讨论。信号级抗噪处理这种处理是从带噪语音信号中提取尽可能纯净的原始语音，在语音信号处理中称为语音增强。语音增强技术在语音通讯、语音识别中有都有应用。在实际应用推动下，早在60 年代语音增强这个课题就已引起了人们的注意，70 年代形成一个高潮，取得了一些基础性成果。由于噪声来源众多，并随应用场合而异，它们的特性也各不相同，因此，即便是在实验室仿真条件下，也难以找到一种通用的、能适用于各种噪声环境的语音增强算法。这就表明：必须针对不同噪声，采取不同的语音增强对策。文论述了如下一些语音增强方法：LPC 全极点模型增强算法、最大后验概率估计法、卡尔墁滤波法、维纳滤波法、谱减法及其改进形式、最小均方误差估计。则分别对噪音同化法、子波消噪算法、小波单阈值消噪算法、小波频带阈值消噪算法、使用心理声学准则的残余噪声抑制法进行了论述。在上述方法中，谱减法是语音增强领域中用得最广泛的方法之一，但它也有明显的缺点，即信号在去噪处理后将带有明显的音乐噪声。利用心理声学原理给出了适用于各种语音增强方法后处理的残余噪声抑制法。微软公司曾将干净语音的数据加上各种噪声后做语音增强，然后再进行特征参数提取、训练模型参数，而在识别时，先进行语音增强处理，然后再进行识别。这种方法的特别之处在于：噪音是人为地加入到训练用的干净语音中的。因此，我们可以将这种方法视为一种“反语音增强”的去噪识别方法。按微软公司的报告，这种方法对噪音有很好的鲁棒性。针对汽车噪音，我们的实验表明，小波频带阈值消噪算法的去噪效果在听觉和端点信息保留方面具有一定的优势，其效果要明显好于前面提到的噪音同化法、均值滤波法、谱减法等各种方法。小波频带阈值消噪算法的具体步骤如下：（1）对原始语音数据做N－1 次小波变换，得到N 个频带的小波系数。（2）认为原始语音的前0.1 秒是纯噪音，并根据这些噪音数据在各频带上的小波系数，给出频带各自的噪音最大值的估计M(i),i=0,…,N-1。其中，i 是频带标号。（3）设定相对阈值K,令每个频带的阈值D(i)=K*M(i),i=0,…,N-1。（4）对各频带小波系数x(j)进行软滤波：x(j)=sgn(x(j))*Max{abs(x(j))-D(i),0}。其中j 是小波系数的下标。（5）对新小波系数进行N－1 次相应的反小波变换，得到语音增强信号。特征参数级抗噪处理目前绝大多数识别系统使用倒频谱类特征参数，例如LPC-CEP,MEL-CEP,FFT-CEP 等，大量的实验表明，这些特征参数对环境噪音的鲁棒性并不好。可以将特征参数级抗噪处理方法分为三类: 第一类在特征参数的计算过程中去除噪音的影响；第二类是特征参数变换法；第三类是提取新的抗噪特征参数。文提出了特征参数标准化方法,文又对之加以改进,这种方法属于第二类。具体的一种实