基于计算机仿真的语音增强算法研究.docVIP

下载本文档

0
0
约4.01千字
约 7页
2016-09-04 发布于北京
举报
版权申诉

基于计算机仿真的语音增强算法研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于计算机仿真的语音增强算法研究.doc

基于计算机仿真的语音增强算法研究　　【摘要】在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声、乃至其它讲话者的干扰。这些干扰最终将使接收者接语音收到的语音是非纯净的原始语音信号，而是受噪声污染的带噪语音信号。语音增强是解决噪声污染的一种有效方法，是从带噪语音信号中提取尽可能纯净的原始语音，本文研究的是一种基于普减法的改进语音增强算法。　　【关键词】语音增强谱减法 Matlab 　　1 引言　　语音增强已发展为语音信号数字处理的一个重要分支。语音增强中的谱减法是处理宽带噪声的最通用技术，即从带噪语音估值中减去噪声频谱估值，而得到纯净语音的频谱。宽带噪声通常可以假定为高斯噪声和白噪声。它的来源很多，包括空气流动、呼吸噪声和一般随机噪声源。量化噪声通常作为白噪声来处理，也可以视为宽带噪声。由于宽带噪声与语音信号在时域和频域上完全重叠，因而消除它最为困难。由于人耳对语音频谱分量的相位不敏感，所以谱减法主要针对短时幅度谱。　　2 语音增强算法　　2.1 传统谱减法　　假定语音为平稳信号，而噪声及假定语音为平稳信号，而噪声和语音为加性信号且彼此不相关。此时带噪语音信号可表示为：　　式中，为纯净语音信号，为平稳加性高斯噪声。实际上，为避免分帧时的截断效应，应对加窗。为了书写方便，这里用代表加窗后的带噪信号。　　设的傅里叶系数为：　　的傅里叶系数为：　　的傅里叶系数为：由（1）式，则有：　　而语音增强的任务就是利用已知的噪声功率谱信息，从中估计出。由于人耳对相位不敏感，所以只要估计出，然后借用带噪语音相位，进行反傅里叶变换后就可得到增强的语音。　　经FFT后，有，由此可得式⑵ 　　式中*表示复共轭。因为假定噪声是不相关的，即与独立，不会出现信号和噪声的乘积值，则互谱的统计均值为0。　　而为零均值的高斯分布，所以有：式⑶ 　　只要从中减去便可恢复。之所以能这样是基于人耳对语音相位不敏感（相聋）这一特点。因为噪声是局部平稳的，故可以认为语音前的噪声与发语音期间的噪声功率谱相同，因而可以利用发语音前（或后）的“寂静帧”来估计噪声。对于一个分析帧内的短时平稳过程，有式⑷ 　　其中，为无语音时的统计平均值，即　　由此可得原始语音的估计值式⑸ 　　实际计算中，也可能出现小于的情况，因此功率谱不可为负，此时修改式⑸为式⑹，式中ε为一个大于0的常数，它由试验确定。定义第k个频谱分量的增益函数以及后验信噪比，则式⑸可以改写为：式⑺ 　　由式⑺可以清楚地看出谱相减的物理意义：它相当于对带噪语音的每一个频谱分量乘以一个系数当信噪比高时，含语音的可能性很大，衰减小。反之，则认为含有语音的可能性小，衰减则增大。　　2.2 改进的谱减法　　式⑸中的是以无声期间的统计平均的噪声方差代替当前分析帧的噪声频谱，而实际上噪声频谱服从高斯分布　　式⑻ 　　其中，m为x的均值，σ为标准偏差。噪声的帧功率谱随机变化范围很宽，在频域中的最大、最小值之比往往达到几个数量级，而最大值与均值之比也达6～8倍。因而，在减去噪声谱后，会有些较大的功率谱分量的剩余部分，在频谱上呈现出随机出现的尖峰，在听觉上形成残留噪声。这种噪声具有一定的节奏性起伏感，所以称之为“音乐噪声”。　　为有效地减少宽带和音乐噪声，可对谱减法进行改进。噪声的能量往往分布于整个频谱范围，而语音能量则较集中于某些频率或频段，尤其在元音的共振峰处。因此可在元音段等幅度较高的时帧去除噪声时，减去，则可更好地相对突出语音的功率谱。这种改进也称为被减项权值处理。　　同时，将式（5）中的功率谱计算|*|2及|*|1/2改为|*|m和|*|1/m计算（这里m不一定为整数），可以增加灵活性。这种方法称为功率谱修正处理。经分析和试验得知，当m2时，它具有与被减项加权处理相同的效果。　　综合上面两种处理，谱减法改进形式的原理框图如图2所示。　　此时式⑸修正为式⑼。引入m，n两个参数为计算提供了很大的灵活性。当m=2，n=1时即变为基本的谱减法，实际的增强试验表明，适当调节m、n可以获得比传统的谱减法更好的增强效果。因此实际的增强过程中，更多地使用谱减法的改进形式。　　3 基于MATLAB的算法实现与仿真　　3.1传统谱减法的实验与仿真　　基于MATLAB来实现传统谱减法的仿真，读入语音文件用wavread函数实现，对采样点补足帧的整数倍是方便实现MATLAB的矩阵计算以及最后对帧叠加进行还原处理。对每一帧独立的含噪语音进行语音增强处理，再将每帧增强语音依次连接起来，会由于恢复的信号帧间不连续，使得增强语音含有周期性的杂音，因