和n1(n)信号 - read.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
蓝色为原始噪声黄色为双话筒自适应语音降噪处理结果紫色为三个麦克风自适应语音降噪处理结果二噪声的特性从统计特性的角度讲平稳噪声和非平稳噪声白噪声是平稳噪声中的一种其频谱和功率谱为常数其概率密度分布是满足正态分布语音增强的原理和方法一频域语音增强技术二时域语音增强技术三时频语音增强技术四麦克风阵列语音降噪技术一频域语音增强技术是语音信号中的一种重要技术由于其原理简单所以被广泛使用如手机中的降噪处理就是采用的此方法美国的产品中就是应用的这技术谱相减法是频域语音增强技术的常用方法谱相减法的基本原理描述谱

蓝色为原始噪声;黄色为双话筒自适应语音降噪处理结果;紫色为三个麦克风自适应语音降噪处理结果。 二、噪声的特性 从统计特性的角度讲:平稳噪声和非平稳噪声。白噪声是平稳噪声中的一种,其频谱和功率谱为常数,其概率密度分布是满足正态分布。 §12.3 语音增强的原理和方法 一、频域语音增强技术 二、时域语音增强技术 三、时频语音增强技术 四、麦克风阵列语音降噪技术 一、频域语音增强技术 是语音信号中的一种重要技术,由于其原理简单所以被广泛使用,如手机中的降噪处理就是采用的此方法,美国NCT的Clear Speech产品中,就是应用的这技术。谱相减法是频域语音增强技术的常用方法。 1. 谱相减法的基本原理描述 2. 谱相减法的数学推导 3. 谱相减法的特点 1. 谱相减法(Spectral Subtraction)的基本原理描述 DFT 平方 平方 DFT + - 插入 相位 开方 IDFT 含噪语音 x(n)=s(n)+d(n) |X(ejw)| d(n) |D(ejw)| 纯噪 声 |S(ejw)| ejarg(X(jw)) s(n) 原始语音谱幅度的估值 将含噪语音信号和有声/无声判别得到的纯噪声信号进行DFT变化,从含噪语音谱幅度的平方中减去纯噪声的谱幅度的平方,然后开方,得原始语音谱幅度的估值,再借用含噪语音的相位,进行IDFT变化,得到增强的语音。 2. 谱相减法的数学推导 首先假设语音和噪声信号是线性叠加的,且噪声是平稳的,噪声与语音信号不相关。 x(n)=s(n)+d(n) X(ejw)=S(ejw)+D(ejw) 简写为: X(w)=S(w)+D(w) X(w)? X*(w) =(S(w)+D(w)) ? (S(w)+D(w))* 展开得到: |X(w)|2=|S(w)|2+ |D(w)|2+ S(w) ? D*(w) + S*(w) ? D (w) 对上式两边取数学期望有: E[ |X(w)|2 ]= E[ |S(w)|2 ] + E[ |D(w)|2 ] + E[ S(w) ? D*(w) ] + E[ S*(w) ? D (w) ] 由于噪声与语音信号不相关,且傅立叶变换不会改变信号之间的相关性,上式中,最后两项均为0。则上式简化为: E[ |X(w)|2 ]= E[ |S(w)|2 ] + E[ |D(w)|2 ] 利用语音信号的短时平稳性,加之噪声信号的平稳性。由于傅立叶变换不会改变信号的统计特性,在一帧中,X(w) 、S(w)和D(w)都是平稳的。因此,在一帧内可用单个值来代替均值。 |X(w)|2 =|S(w)|2 + |D(w)|2 利用有声/无声判决的纯噪声信号d(n)与d(n)不完全一致,因此: |S(w)| 2 =|X(w)|2 -|D(w)|2 =|S(w)|2 + |D(w)|2 -|D(w)|2 s(n) =IDFT[ |S(w)| ejarg(X(jw)) ] 3. 谱相减法的特点 (1)原理简单,只需要一个话筒,故又称为单话筒语音降噪。 话音 噪声 谱相减法处理 输出 话筒 (2) 需要无声和有声判决,在信噪比大的情况下,使用短时平均能量等参数可达到效果。 (3)由于该方法存在的前提条件要求噪声平稳,因此当噪声特性变化时,消噪效果可能会变差,这时需要重新拾取噪声特性。 (4)由于噪声的随机分布的范围广,因此相减时,若该帧某频率点上的噪声谱幅度分量大时,就会有很大一部分残留,在频谱上呈现随机起伏的尖峰。在听觉上形成有节奏的类似音乐的残留噪声,又称为背景音乐噪声。背景音乐噪声损伤了语音的质量,降低了可懂度和清晰度,是该类方法最大的缺点。 蓝色为原始含噪语音 黄色为谱相减处理的结果 二、时域语音增强技术 语音增强中另一常用技术,其特点是对语音的损伤小。在消噪过程中,一般需要二个以上话筒,采用自适应滤波算法。故常常将时域语音增强技术称为自适应语音降噪技术(Adaptive noise canceling ANC)。 主话筒和参考话筒获得的信号是语音和噪声在话筒处迭加后的混合信号。 话音 噪声 + 自适应滤波器 主话筒 + 输出 参考话筒 - 主信号s+n0,为有用信号s(来自信号源)和一个与它不相关的噪声信号的混合而成。 n1为另外拾取的噪声参考信号,与n0相

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档