- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验二 语音信号的频域处理
一、 实验目的、要求
(1)掌握语音信号频域分析方法
(2)了解语音信号频域的特点
(3)了解谱减法作为频域语音增强的原理与编程实现
(3)了解谱减法的缺点,并分析产生该缺点的原因
二、实验原理
语音虽然是一个时变、非平稳的随机过程。但在短时间内可近似看作是平稳的。因此如果能从带噪语音的短时谱中估计出“纯净”语音的短时谱,即可达到语音增强的目的。由于噪声也是随机过程,因此这种估计只能建立在统计模型基础上。利用人耳感知对语音频谱分量的相位不敏感的特性,这类语音增强算法主要针对短时谱的幅度估计。
短时话幅度估计概述设一帧加窗后的带噪语音为(2.1)其中为纯净语音,假设为平稳加性高斯噪声。将在一组基上展开,使展对系数为各不相关的随机变量。设的相关函数为,由K-L展开得知满足(2.2)则的展开式为(2.3)如果的相关长度小于帧长N,则的近似函数为(2.4)可见的展开过程实际上相当于离散博里叶交换,其展开系数(为傅里叶变换系数。由,则有:。其中、、分别为、及的傅里叶交换系数。由于假设噪声是高斯分布的,其傅里叶系数相当于多个高斯样本的加权和,故可认为仍然为高斯分布。其均值为0,方差可通过无语音时对噪声的分析而获得。
语音增强的任务就是利用已知的噪声功率谱信息,从中估计出。由于人耳对相位不敏感,故只需估计出,然后借用带噪语音的相位,进行傅里叶逆变换就可得到增强的语音。基于短时谱幅度估计的方法的原理图如图2.1所示。图2.1 短时谱估计原理图
在短时谱幅(STSA)估计基础上,人们提出了许多语音增强算法。基本思想是利用输入带噪语音短时谱幅来估计清洁语音短时谱幅,结合带噪语音相位信息,得到增强信号。
运用短时傅里叶变换(STFT)和重叠相加是短时谱估计技术中最常用的方法。输入信号的短时谱幅与一个修正因子相乘,得到增强信号谱幅度(通常修正因子与噪声信号谱幅估计密切相关);或将含噪语音谱幅减去噪声谱幅估计,得到增强信号谱幅,这些方法统称为相减类型算法(subtractive-type algorithms)。噪声谱幅估计可以通过有声、无声检测获取。一般认为噪声与信号不相关,增强信号谱幅是清洁语音信号的谱幅估计。通常假设人耳对含噪语音相位产生的畸变不敏感,所以进行IDFT恢复成时域信号时,含噪语音的相位一般不作处理。
三、使用仪器、材料
微机(带声卡)、耳机,话筒。
四、 实验步骤
分析含噪语音信号的频谱(幅度谱和相位谱)
获取噪声信号频谱(幅度谱)
对含噪语音信号进行分帧并进行加窗处理
将含噪语音信号谱和噪声谱作为输入,进行谱减法
回复增强语音信号帧.
对比输入信号与增强信号波形,分析算法对其产生的影响.
五、实验过程原始记录(数据,图表,计算)
假设为含噪语音离散时间序列,由清洁语音信号和非相关加性噪声信号组成。可表示为
=+(2.5)
将输入信号按帧处理,前后帧之间重叠(一般为50%),对每帧含噪语音进行加窗处理,然后进行FFT变换,变换到频率域。含噪语音的能量谱可以表示为
+(2.6)
其中为
==(2.7)
其中为含噪语音的相位。
由于没法直接得到含噪语音中噪声能量谱,一般将无声阶段的数帧噪声信号进行能量谱加权平均得到噪声能量谱估计。假设噪声与语音信号不相关,语音能量谱估计为
=-(2.8)
其中清洁语音能量谱估计由含噪语音能量谱减去噪声能量谱估计得到。由于噪声能量谱估计与含噪语音中噪声能量谱之间存在差异,式(3.4)可能出现负值,为了避免能量谱出现负值,将这些负值设为零,这一处理称为半波整流(half-wave rectification)。通过半波整流,清洁语音能量谱估计可表示为(2.9)
结合含噪语音相位信息,通过逆离散傅里叶变换(IDFT)得到时域清洁语音信号的估计信号。=IDFT()(2.10)
其中增强语音信号频谱也可以通过时变滤波器重建
=(2.11)
式中时变滤波器(或称为增益函数)可表示为(2.12)
六:实验结果,及分析图2.2 谱减法结果分析
实验结果:图2.2中(a),(c)为不同信噪比输入含噪语音信号,图2.2中(b),(d)为对应增强语音信号。当信噪比较低时,降噪效果较差。并且引入音乐噪声。
算法缺陷分析:
(1)不可避免的引入音乐噪声。要有效地滤除含噪语音中的噪声,需要准确地估计含噪语音中噪声的频谱。噪声谱估计越准确,增强信号谱中音乐噪声越小。然而,由于不能直接得到噪声谱,在绝大多数谱相减算法中,通过加权平均无声阶段噪声谱得到噪声谱估计,这种噪声谱估计与含噪语音中的瞬时噪声谱存在差异,噪声平稳性越差,差异越大,由于这种差异的存在,谱相减不可避免地引入音乐噪声。
(2) 半波、全波整流
式(3.4)中负能量值的产生是由于噪声谱估计发生了错误。这些负值用半波整流(被设定
文档评论(0)