- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第14章 语音增强
第15章 语音增强 目录 15.1 概 述 15.2语音特性、人耳感知特性及噪声特性 15.2.1 语音特性 15.2.2人耳感知特性 15.2.3噪声特性 15.3滤波器法 15.3.1固定滤波器 15-.3.2自适应滤波 15.3.3变换技术 15.4非线性处理 15.4.1 中心削波 15.4.2同态滤波法 15.5减谱法 15.5.1减谱法 15.5.2减谱法的改进形式 15.6自相关相减法 15.7自适应噪声对消 15.7.1自适应滤波 15.7.2具有参考信号的自适应噪声对消 15.7.3利用延迟来建立参考信号的自适应噪声对消 15.1 概 述 语音增强是解决噪声污染的一种有效方法,它的一个主要目标是从带噪语音信号中提取尽可能纯净的原始语音,即去掉语音信号中的噪声和干扰,改善它的质量。 语音增强是语音信号处理系统的重要组成部分。 各种增强方法各有长处并且适用于不同的应用场合。 15.1 概 述 语音增强的目的主要有两个: 一是改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳,这是一种主观度量; 二是提高语音可懂度,这是一种客观度量。这两个目的往往不能兼得。 语音增强方法 语音增强方法有多种,大致分为三类: ①基于语音产生模型 如:线性滤波法、梳状滤波法、自相关法 ②基于语音模型和噪声模型 如:维纳滤波法、卡尔曼滤波法 ③基于噪声特性(短时谱估计) 如:频谱减法、自适应噪声抵消法 15.2语音特性、人耳感知特性及噪声特性------语音特性 语音是一时变的、非平稳的随机过程,但由于一段时间内(10~30 ms)人的声带和声道形状的相对稳定性,可认为其特征是不变的,因而语音的短时谱具有相对稳定性。 在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽带噪声区分。 语音信号可以用统计分析特性来描述。语音的短时谱幅度的统计特性是时变的,只有当分析帧长趋于无穷大时,才能近似认为其具有高斯分布。高斯分布模型是根据中心极限定理得到的,将高斯模型应用于有限帧长只是一种近似的描述。在宽带噪声污染的语音增强中,可将这种假设作为分析的前提。 15.2语音特性、人耳感知特性及噪声特性------人耳感知特性 语音感知问题涉及到生理学、心理学、声学和语音学诸多领域,人耳对背景噪声有很大的抑制作用,其中很多问题有待进一步研究。目前已有一些结论可用于语音增强: ① 人耳对语音的感知主要是通过其幅度谱获得的,而对相位谱则不敏感。 ② 人耳对频率高低的感受近似与该频率的对数值成正比。 ③ 人耳有掩蔽效应,即强信号对弱信号有抑制作用,能够将其掩盖。利用人耳的生理特点,提高语音信号的信噪比,使有用的语音信号大于噪声一定级别,就可以在语音与噪声共存的情况下感觉不到噪声的存在。 ④ 共振峰对语音的感知十分重要,特别是第二共振峰比第一共振峰更为重要,因此对语音信号进行一定程度的高通滤波不会对可懂度产生影响。 ⑤ 人耳在两个人以上的说话环境中能够分辨出他所需要的声音。 15.2语音特性、人耳感知特性及噪声特性------噪声特性 周期性噪声的特点是有许多离散的窄谱峰, 来源于发动机等周期性运转的机械。 可以容易地通过检查功率谱发现并通过滤波或变换技术将其去掉。 冲激噪声表现为时域波形中突然出现的窄脉冲 是放电的结果。 根据带噪语音信号幅度的平均值确定阈值。当信号幅度超出这一阈值时,判别为冲激噪声,再对其进行衰减甚至完全消除。 如果干扰脉冲之间不太靠近,还可以根据信号相邻样本数值简单地通过内插法将其从时间函数中去掉。 宽带噪声通常可以假定为高斯噪声和白噪声。 来源:风、呼吸噪声和一般随机噪声源。 量化噪声通常作为白噪声来处理,也可以视为宽带噪声。 消除的最成功的方法利用了某些非线性处理。目前的一些方法虽然降低了背景噪声,提高了信噪比,但并不提高语音的可懂度。 15.2语音特性、人耳感知特性及噪声特性------滤波器法 有三种常用的滤波器: 固定滤波器 自适应滤波器 傅里叶变换滤波器。 15.2语音特性、人耳感知特性及噪声特性------固定滤波器 固定滤波器用于滤除平稳干扰成分。 最常见的是50或60 Hz交流声。 滤除60 Hz成分很少采用高通滤波器,因为干扰是由60 Hz的奇次谐波引起的,特别是3~7次谐波(交流哼声就是60 Hz交流声,它具有丰富的谐波,这种谐波一般是由于话筒输入插孔没有接地而造成的)。 15.2语音特性、人耳感知特性及噪声特性------固定滤波器 (a)中,它由一个延时器和一个加法器构成。延迟时间为T,它等于滤波器凹口间的间隔f0的倒数。
您可能关注的文档
- 第10章 VBA程序设计基础1.ppt
- 第10章 准备方式.ppt
- 第10章 C语言的文件.ppt
- 第10章 UG二次开发入门.doc
- 第10章 信息隐藏与数字水印.pptx
- 第10章 内存管理.ppt
- 第10章 Access 2003综合应用实例.ppt
- 第10章 对文件的输入输出-0.ppt
- 第10章 其他有机毒物及其代谢产物的测定.ppt
- 第10章 半导体式化学传感器.ppt
- 《2025年低空经济无人机运维与地面服务市场需求分析及服务模式创新》.docx
- 2025及未来5年乙二胺四己酸二钠项目投资价值分析报告.docx
- 2025至2030救护船市场细分市场及应用领域与趋势展望研究报告.docx
- 2025年慢性病管理行业糖尿病饮食个性化方案报告.docx
- 《2025年医疗设备租赁服务在基层医院人力资源配置》.docx
- 《储能参与电力市场报告202辅助服务收益成本控制》.docx
- 初中语文七年级必读名著阅读知识点归纳-七上语文名著.docx
- 2025年休闲食品行业品牌忠诚度调研报告.docx
- 2025及未来5年铜衬套项目投资价值分析报告.docx
- 2025年平板电脑芯片行业市场增长潜力报告.docx
最近下载
- “新质生产力”系列(五):聚势而飞,低空经济主题投资研究.pptx VIP
- 《GB_T 45526 - 2025北斗_全球卫星导航系统(GNSS)实时动态精密单点定位状态域改正产品规范》最新解读.pptx VIP
- 船舶定位与导航电子海图与电子海图系统1古野FMD3200电子海图使用说明书.pdf
- “新质生产力”系列(四):围绕“五篇大文章”构建投资策略.pdf VIP
- 《园林景观手绘技法表现》教案——项目4园林景观平面图表现技法.docx VIP
- 新质生产力六大主线巡礼.pdf VIP
- “新质生产力”系列(四):围绕“五篇大文章”构建投资策略.docx VIP
- “新质生产力”系列(八):八大新兴产业及九大未来产业巡礼-国信证券-202412.docx VIP
- 乳腺癌的分子分型.pptx VIP
- 新质生产力系列专题(七):科技股盈利提升之路有哪些?.docx VIP
原创力文档


文档评论(0)