- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中英翻译《使用加权滤波器的一种改进的谱减语音增强算法》
使用加权滤波器的一种改进的谱减语音增强算法
摘要
在噪声环境,例如飞机座舱、汽车引擎中,语音中或多或少地夹杂着噪声。为了减少带噪语音中的噪声,我们提出了一种改进型的谱减算法。这种算法是利用对谱减的过度减法而实现的。残余噪声能够利用人类听觉系统的掩蔽特性被掩蔽。为了消除残余的音乐噪声,引入了一种基于心理声学的有用的加权滤波器。通过仿真发现其增强的语音并未失真,而且音乐噪声也被有效地掩蔽,从而体现了一种更好的性能。
关键词:语音增强;谱减
1.引言
语音信号中经常伴有环境中的背景噪声。在一些应用中如:语音命令系统,语音识别,说话者认证,免提系统,背景噪声对语音信号的处理有许多不利的影响。语音增强技术可以被分为单通道和多通道或多通道增强技术。单通道语音增强技术的应用情况是只有一个采集通道可用。
谱减语音增强算法是一个众所周知的单通道降噪技术。大多数实现和多种基本技术的运用是在语音谱上减去对噪声谱的估计而得以实现的。传统的功率谱相减的方法大大减少了带噪语音中的噪声水平。然而,它也在语音信号中引入了一种被称为音乐噪声的恼人的失真。
在本文中我们运用一种能够更好、更多地抑制噪声的改进的频谱过度减法的方法。该方法的运用是为了估计纯净语音的功率谱,它是通过从语音功率谱中减去噪声功率谱的过度估计而实现的。此外,为了在语音失真和噪声消除之间找到最佳的平衡点,一种基于声学心理学的动机谱加权规则被纳入。通过利用人耳听觉系统的掩蔽特性能够掩蔽现有的残余噪声。当确定了语音掩蔽阈值的时候,运用一种改进的掩蔽阈值估计来消除噪声的影响。
该方法提供了比传统的功率谱相减法更优越的性能,并能在很大程度上降低音乐噪声。
2.过度谱相减算法
该方法的基本假设是把噪声看作是独立的加性噪声。假设已经被不相关的加性噪声信号降解的语音信号为:
(1)
带噪语音信号的短时功率谱近似为:
(2)
通过用无音期间得到的平均值代替噪声的平方幅度值得到功率谱相减的估计值为:
(3)
在运用了谱减算法之后,由于估计的噪声和有效噪声之间的差异而出现了一种残余噪声。这在语音信号中被认为是一种失真,并被称为音乐噪声。为了减少残余的音乐噪声,Berouti提出了一种重要的改进型谱减算法。它通过减去对噪声功率谱的过高估计而使形成的频谱被限制在一个预设的最低水平(频谱基底)。该算法被描述为:
(4)
其中是减法因子,是频谱基底参数。
为了减少因提高的值而导致的语音失真,它的值是要与每一帧是相适应的。它的基本思想是考虑到减法过程必须取决于帧中的分段的带噪语音的信噪比(NSNR),以实现用较少的算法实现较高的带噪语音的信噪比,反之亦然。
对于每一帧分段语音的信噪比的计算如下:
(5)
过度减法因子可被计算为:
(6)
其中是时的理想值。
通过对语音信号的幅度估计和输入语音信号的相位可以得到增强后的语音频谱为:
(7)
输入信号的相位被用于估计信号频谱重构,这是基于人类对短时谱幅度的感知比对相位谱的感知更加敏感这一事实。
3.听觉掩蔽模型
为了进一步增强语音的质量,引入了一种基于心理声学谱加权规则,这种方法是由提出的算法而被激发的。在过度谱相减之后,在估计的纯净语音中仍然存在一些残余的音乐噪声。这种存在的残余的音乐噪声能够利用人耳听觉系统的掩蔽特性被掩蔽。
有三种类型的掩蔽效果:同时掩蔽,向前掩蔽和向后掩蔽。我们考虑的仅仅是掩蔽的同时效果,即:在某一频率点上弱信号能够被这一频率附近的同时输入的强信号所掩蔽(是不被感知的)。
首先我们计算噪声掩蔽阈值,它是指现存的语音中不可闻的噪声的最大声压级。噪声掩蔽阈值是由人耳的频率选择模型和人耳听觉掩蔽特性而得到的。不同的计算方法所采取的步骤如下所述。
3.1临界带宽大小的频率分析
在0-4kHZ的频率范围内,总有18个临界带宽。第一步是临界带宽分析,式中的是运用谱相减算法估计的纯净语音FFT的功率谱,并把每一临界带的能量加起来。运用这种方法得到k个临界带宽的功率谱密度为:
(8)
其中k是临界带宽编号,K=18是临界带宽的总数及是取决于临界带宽的频率上限和频率下线的频率指数。
3.2扩展函数卷积
在不同的临界频带之间存在着相互掩蔽的效应,扩展函数是用来估计不同临界带宽之间的掩蔽效应,它在频率上是不对称的并应用在临界带宽上。扩展函数的解析表达式可以表示为:
(9)
临界带宽的功率谱与扩展函数卷积可以得到扩展临界带宽谱:
(10)
3.3相对门限偏移量
从每一临界频带中减去相对门限偏移量。对此阈值的计算,需
您可能关注的文档
最近下载
- 2025年高考数学第一轮复习一轮复习83练目录.docx
- 下水道疏通工人培训课件.pptx
- 国有企业党委书记2024年民主生活会个人对照检查发言材料(四个带头).docx VIP
- 《国有企业管理人员处分条例》重点解读.pptx VIP
- 2024年民主生活会个人对照检查发言材料(四个带头).docx VIP
- 领导干部2024年民主生活会对照检查发言材料(四个带头).docx VIP
- 2025届河北省高考化学二轮复习计划安排 课件.pptx
- 《国有企业管理人员处分条例》学习解读课件.pptx VIP
- 人教版(2024)英语七年级下册Unit2 No Rules,No Order单元小测(含解析).docx VIP
- 2025届高考一轮复习:小说叙事艺术.pptx VIP
文档评论(0)