- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
称之为无源噪声控制passivenoisecontrol-read
蓝色为原始噪声;黄色为双话筒自适应语音降噪处理结果;紫色为三个麦克风自适应语音降噪处理结果。 二、噪声的特性 从统计特性的角度讲:平稳噪声和非平稳噪声。白噪声是平稳噪声中的一种,其频谱和功率谱为常数,其概率密度分布是满足正态分布。 §12.3 语音增强的原理和方法 一、频域语音增强技术 二、时域语音增强技术 三、时频语音增强技术 四、麦克风阵列语音降噪技术 一、频域语音增强技术 是语音信号中的一种重要技术,由于其原理简单所以被广泛使用,如手机中的降噪处理就是采用的此方法,美国NCT的Clear Speech产品中,就是应用的这技术。谱相减法是频域语音增强技术的常用方法。 1. 谱相减法的基本原理描述 2. 谱相减法的数学推导 3. 谱相减法的特点 1. 谱相减法(Spectral Subtraction)的基本原理描述 DFT 平方 平方 DFT + - 插入 相位 开方 IDFT 含噪语音 x(n)=s(n)+d(n) |X(ejw)| d(n) |D(ejw)| 纯噪 声 |S(ejw)| ejarg(X(jw)) s(n) 原始语音谱幅度的估值 将含噪语音信号和有声/无声判别得到的纯噪声信号进行DFT变化,从含噪语音谱幅度的平方中减去纯噪声的谱幅度的平方,然后开方,得原始语音谱幅度的估值,再借用含噪语音的相位,进行IDFT变化,得到增强的语音。 2. 谱相减法的数学推导 首先假设语音和噪声信号是线性叠加的,且噪声是平稳的,噪声与语音信号不相关。 x(n)=s(n)+d(n) X(ejw)=S(ejw)+D(ejw) 简写为: X(w)=S(w)+D(w) X(w)? X*(w) =(S(w)+D(w)) ? (S(w)+D(w))* 展开得到: |X(w)|2=|S(w)|2+ |D(w)|2+ S(w) ? D*(w) + S*(w) ? D (w) 对上式两边取数学期望有: E[ |X(w)|2 ]= E[ |S(w)|2 ] + E[ |D(w)|2 ] + E[ S(w) ? D*(w) ] + E[ S*(w) ? D (w) ] 由于噪声与语音信号不相关,且傅立叶变换不会改变信号之间的相关性,上式中,最后两项均为0。则上式简化为: E[ |X(w)|2 ]= E[ |S(w)|2 ] + E[ |D(w)|2 ] 利用语音信号的短时平稳性,加之噪声信号的平稳性。由于傅立叶变换不会改变信号的统计特性,在一帧中,X(w) 、S(w)和D(w)都是平稳的。因此,在一帧内可用单个值来代替均值。 |X(w)|2 =|S(w)|2 + |D(w)|2 利用有声/无声判决的纯噪声信号d(n)与d(n)不完全一致,因此: |S(w)| 2 =|X(w)|2 -|D(w)|2 =|S(w)|2 + |D(w)|2 -|D(w)|2 s(n) =IDFT[ |S(w)| ejarg(X(jw)) ] 3. 谱相减法的特点 (1)原理简单,只需要一个话筒,故又称为单话筒语音降噪。 话音 噪声 谱相减法处理 输出 话筒 (2) 需要无声和有声判决,在信噪比大的情况下,使用短时平均能量等参数可达到效果。 (3)由于该方法存在的前提条件要求噪声平稳,因此当噪声特性变化时,消噪效果可能会变差,这时需要重新拾取噪声特性。 (4)由于噪声的随机分布的范围广,因此相减时,若该帧某频率点上的噪声谱幅度分量大时,就会有很大一部分残留,在频谱上呈现随机起伏的尖峰。在听觉上形成有节奏的类似音乐的残留噪声,又称为背景音乐噪声。背景音乐噪声损伤了语音的质量,降低了可懂度和清晰度,是该类方法最大的缺点。 蓝色为原始含噪语音 黄色为谱相减处理的结果 二、时域语音增强技术 语音增强中另一常用技术,其特点是对语音的损伤小。在消噪过程中,一般需要二个以上话筒,采用自适应滤波算法。故常常将时域语音增强技术称为自适应语音降噪技术(Adaptive noise canceling ANC)。 主话筒和参考话筒获得的信号是语音和噪声在话筒处迭加后的混合信号。 话音 噪声 + 自适应滤波器 主话筒 + 输出 参考话筒 - 主信号s+n0,为有用信号s(来自信号源)和一个与它不相关的噪声信号的混合而成。 n1为另外拾取的噪声参考信号,与n0相
您可能关注的文档
最近下载
- 点绛唇赋登楼原版正谱五线谱钢琴谱高考声乐谱.pdf VIP
- GE通用家用电器 GHCT03XCCC 说明书.pdf
- 小学:五年级语文上册总复习知识点汇总(第七、八单元).docx VIP
- 专题13 写作(四川专用)(解析版)【好题汇编】三年(2023-2025)中考语文真题分类汇编.docx VIP
- GBT-牛冠状病毒感染诊断技术编制说明.pdf VIP
- NY_T 1248.1-2006 玉米抗病虫性鉴定技术规范 第1部分:玉米抗大斑病鉴定技术规范.doc VIP
- 安全生产管理咨询服务总结报告——XX项目.pdf VIP
- 一种纳米颗粒掺杂钙钛矿的钙钛矿光探测器及其加工工艺.pdf VIP
- 专题11 作文(辽宁专用)(解析版)【好题汇编】三年(2023-2025)中考语文真题分类汇编.docx VIP
- 幼儿园配班老师培训.pptx
原创力文档


文档评论(0)