- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于改进型谱减法的语音增强技术研究
基于改进型谱减法的语音增强
摘 要
本文主要研究改进型谱减算法在语音增强中的应用,目的是增强语音质量,减少语音失真和提高其可度懂。我们首先介绍了语音增强的研究意义,然后介绍了语音信号的相关理论,进而阐述了语音增强的基本谱减法的原理,并在此基础上提出了一种改进型谱减算法。该算法通过语音激活检测(端点检测法)来确定“寂静段”(纯噪声段),从而对噪声功率谱进行重新估计。为了减小基音检测算法可能产生的检测误差,采用了组合递归平滑法来减小噪声谱估计的误差。
整个仿真实验中,我们对引入的加性噪声进行处理,其噪声谱估计的性能可在本文中的MATLAB仿真实验中体现。
仿真结果表明,该算法在去除背景噪声的同时,保证了较小的语音失真、提高了信噪比,达到了较好的测听效果。
最后,基于噪声与语音具有一定的相关性的实际情况,我们提出了算法的进一步改进设想,并对此思想做出了数学推导,得到了算法进一步改进的方向及可行性。
关键词:语音增强;谱减法;噪声估计;端点检测;组合递归平滑;仿真实验;改进算法
第1章 背景介绍
1.1研究背景
人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声乃至其他讲话者的干扰。这些干扰最终将使接收者接收到的语音已非纯净的原始语音信号,而是受噪声污染的带噪语音信号。例如,安装在汽车、飞机或舰船上的电话,街道、机场的公用电话,常受到很强背景噪声的干扰,严重影响通话质量。又如,室内会议电话的交混回响随同语音广播到每个会议地点,影响收听效果。再如深海潜水员在氦-氧面罩内讲话引起的失真,语言障碍残疾人的语音失真,有历史价值的旧唱片、旧录音带的噪声和失真等,都是带噪语音信号的例子。
环境噪声污染使许多语音处理系统的性能急剧恶化。例如,语音识别己取得重大进展,正在步入实用阶段。但目前的识别系统大都是在安静环境中工作的,在噪声环境中尤其是强噪声环境,语音识别系统的识别率将受到严重影响。低速率语音编码,特别是参数编码(如:声码器),也遇到类似问题。由于语音生成模型是低速率参数编码的基础,当模型参数的提取受到混杂在语音中背景噪声严重干扰时,重建语音的质量将急剧恶化,甚至变得完全不可懂。在上述情况下,语音增强作为一种预处理手段,不失为解决噪声污染的一种有效途径。
在实际需求的推动下,早在上个世纪60年代语音增强这个研究课题就引起人们的注意,此后40多年人们一直锲而不舍地进行这方面的研究。随着数字信号处理理论的成熟,70年代曾形成一个理论研究高潮,取得了一些基础性成果,并使语音增强发展成为语音信号处理的一个重要分支。进入80年代后,DSP(数字信号处理)技术的发展和成熟为语音增强的实时实现提供了可能。
语音增强不但与语音信号数字处理理论有关,而且涉及到人的听觉感知和语音学范畴。再者,噪声的来源众多,随应用场合而异,它们的特性也各不相同。即使在实验室仿真条件下,也难以找到一种通用的语音增强算法能适用于各种噪声环境,所以必须针对不同噪声,采用不同的语音增强对策。目前,某些语音增强算法在实际应用中己经证明是有效的,它们大体上可分为四类:噪声对消法、谐波增强法、基于参数估计的语音再合成法和基于语音短时谱估计的增强算法。
语音增强的一个主要目标是从带噪语音信号中提取尽可能纯净的原始语音。然而,由于干扰通常都是随机的,从带噪语音中提取完全纯净的语音几乎不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪音,使听者乐于接受,不感觉疲劳,这是一种主观度量;二是提高语音可懂度,这是一种客观度量。这两个目的往往不能兼得。目前有一些对低信噪比带噪语音进行语音增强的方法,可以显著地降低背景噪声,改进语音质量,但并不能提高语音的可懂度,甚至略有下降。
语音增强是语音信号处理的一个重要分支,该技术已广泛应用于无线电话、电话会议、场景录音和军事窃听等领域。语音增强技术无论在日常生活中,还是在军事领域,或者在语音信号处理技术中都很有应用价值。因此研究语音增强算法有很重要的实用价值。
1.2 语音增强的历史和发展现状
语音增强方法的研究始于20世纪70年代中期,随着数字信号处理理论的成熟,语音增强发展成为语音信号处理领域的一个重要分支。1978年,Lim和Oppenheim提出了语音增强的维纳滤波方法。1979年,Boll提出了谱相减方法来抑制噪声。1980年,Maulay和Malpss提出了软判决噪声抑制方法。1984年,Ephraim和Malah提出基于MMSE短时谱幅度估计的语音增强方法。
在近30年的研究中,各种语音增强方法不断被提出,奠定了语音增强理论的基础;并使之逐渐走向成熟。近些年来,随着VLSI技术的发展和高速DSP芯片的出现,使语音增强的实时实现成为可能。语音增强方法逐步走向实
文档评论(0)