语音信号处理 第4版 课件 第6章:语音增强.pptx

语音信号处理 第4版 课件 第6章:语音增强.pptx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

南京邮电大学通信与信息工程学院第6章语音增强

语音特性、人耳感知特性及噪声特性相关特性法滤波器法非线性处理法减谱法与维纳滤波法基于深度学习的语音增强

6.1概述在现实环境下,语音容易受到噪声的影响和干扰,因而噪声的消减对语音识别、低码率符号化等有很强的实用价值。抗噪声技术的研究以及实际环境下的语音信号处理系统的开发国内外的研究大体分为三类:①采用语音增强算法提高语音识别系统前端预处理的抗噪声能力,提高输入信号的信噪比;②寻找稳健的耐噪声的语音特征参数;③基于模型参数适应化的噪声补偿算法。

6.1语音特性语音信号是一种非平稳的随机信号,但可以假定语音信号是短时平稳的,即在10~30ms的时间段内语音的某些物理特性和频谱特性可以近似看作是不变的,从而应用平稳随机过程的分析方法来处理语音信号,并可以在语音增强中利用短时频谱时的平稳特性。任何语言的语音都有元音和辅音两种音素。辅音又分为清辅音和浊辅音。从时域波形上可以看出浊音(包括元音)具有明显的准周期性和较强的振幅,它们的周期所对应的频率就是基音频率;清辅音的波形类似于白噪声并具有较弱的振幅。在语音增强中可以利用浊音具有的明显的准周期性来区别和抑制非语音噪声,而清辅音和宽带噪声就很难区分。语音信号作为非平稳、非遍历随机过程的样本函数,其短时谱的统计特性在语音增强中有着举足轻重的作用。根据中心极限定理,语音的短时谱的统计特性服从高斯分布。但是,实际应用中只能将其看作是在有限帧长下的近似描述。

6.1人耳感知特性人耳对于声波频率高低的感觉与实际频率的高低近似为对数关系;人耳对声强的感觉很灵敏且有很大的动态范围,对频率的分辨能力受声强的影响,;人耳对语音信号的幅度谱较为敏感,对相位不敏感。这一点对语音信号的恢复很有帮助。此外,共振峰对语音感知很重要,特别是前三个共振峰更为重要。人耳具有掩蔽效应,即一个声音由于另外一个声音的出现而导致该声音能被感知的阈值提高的现象。人耳除了可以感受声音的强度、音调、音色和空间方位外,还可以在两人以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。因此,语音增强的最终度量是人耳的主观感觉,所以在语音增强中可以利用人耳感知特性来减少运算代价。

6.1噪声特性噪声可以是加性的,也可以是非加性的,非加性噪声往往可以通过某种变换,如同态滤波转为加性噪声)。加性噪声通常分为冲激噪声、周期噪声、宽带噪声、语音干扰噪声等;非加性噪声主要是残响及传送网络的电路噪声等。通过语音增强技术来改善语音质量的过程如下图所示。常用的语音增强技术有滤波器法、自相关抗噪法、非线性处理法、减谱法、维纳滤波法等。

语音特性、人耳感知特性及噪声特性相关特性法滤波器法非线性处理法减谱法与维纳滤波法基于深度学习的语音增强

6.2滤波器法——陷波器法对于周期噪声采用陷波器是较为简便和有效的方法,其基本思路和要求是设计的陷波器的幅频曲线的凹处对应于周期噪声的基频和各次谐波,如图6-2所示。设计的关键是通过合理设计使这些频率处的陷波宽度足够窄。

6.2滤波器法——陷波器法简单的数字陷波器的传递函数如下:由可以看出f=N/T(N为整数)的频率被滤除掉。且数字滤波器的极零点接近时,信号频谱变化较为缓慢,而在陷波频率处急剧衰减,故引入反馈:当b越接近1时,分母在零点附近处有抵消作用,梳齿带宽变得越窄,通带较为平坦,陷波效果越好。其模拟框图如下图所示。

6.2滤波器法——自适应滤波器1、基本型:自适应滤波器最重要的特性是能有效地在未知环境中跟踪时变的输入信号,使输出信号达到最优,因此可以用来构成自适应的噪声消除器,其基本原理框图如图所示。图中s(t)为语音信号,n(t)为未知噪声信号,y(t)为带噪语音信号,r(t)为参考噪声输入,r(t)与s(t)无关,而与n(t)相关。该滤波器的实质在于实现带噪信号中的噪声估计,并用原始信号y(t)减去估计值r’(t)以达到语音增强的目的。

6.2滤波器法——自适应滤波器2、对称自适应去相关的改进型在有些实际应用中,参考输入r(t)除包含与噪声相关的参考噪声外,还可能含有低电平的信号分量。无疑这些泄漏到参考输入中的语音信号分量将会对消原始输入中的语音信号成分,进而导致输出信号中原始语音信号的损失。下图给出了原始语音信号s(t)通过一个传递函数为J(z)的信道泄漏到参考输入中的情形。这种情况就无法使用自适应噪声对消器进行语音增强。可以证明,如果原始输入和参考输入中的噪声相关,则对消器输出端的信噪谱密度比为参考输入端信噪谱密

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档