- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于子空间的语音去噪算法
摘要:现代理想的语音通信系统在现实环境中并不存在,在实际应用中的通信环境通常都是伴有噪声的。想要减少噪声获得较为纯净的语音,语音去噪变得尤其重要。 本文提出的基于子空间的语音去噪算法,是基于线性代数理论和矩阵分析模型,对含噪语音信号的协方差矩阵进行特征值分解,根据特征值个数的分解情况,分别估计出信号子空间和噪声子空间,随后对语音信号矩阵以及噪声协方差矩阵分别作对角变换,将含噪语音信号映射到信号子空间和噪声子空间这两个相互正交的子空间中,然后对两个子空间分别进行处理,在信号子空间中尽可能的估计出原始的语音信号,从而达到去除混有白色噪声或者有色噪声的语音信号中噪声的目的。该算法的优点在于可以尽量避免音乐噪声的引入,并且语音失真程度和噪声残留程度可以控制在一个相对平衡状态。本文是从子空间的算法开始,对基于子空间的去噪原理以及常用的估计器进行了比较和分析,并且针对不同的信噪比下的白色噪声或有色噪声情况下的语音去噪情况进行了仿真对比。 关键词:语音去噪,信号子空间,噪声 第一章 绪论 1.1选题研究背景与意义 语音是信息传递的载体,在人类日常交流中不可或缺。语音信号由人的声带产生后通过各种媒介不断传播,但是最终接收者收到的语音质量却和传输前的语音质量有所偏差,原因在于在传播的过程中收到各种形式噪声的干扰,使语音的清晰度和可懂度降低。随着科学不断的进步和人们生活的逐步信息化,人们将关注点放在了语音处理等相关技术上,比如对语音信号的识别、传输、存储、合成、增强等操作,不仅可以协助人与人之间的信息交流,而且可以达到人机交互的效果。目前,在数字化通信、多媒体信息处理、说话人识别等领域已有人机交互的实践[1]。 语音信号处理技术涵盖很多内容,其中主要有语音识别、语音编码、语音合成和语音增强等方面。语音信号处理是涉及面广泛的交叉学科,研究领域涉及了神经心理学、语音学、计算机科学、数理统计、模式识别和人工智能等许多领域[1];语音信号的发展不仅依赖于这些学科领域,也同时能带动这些领域的发展。 现实生活中,我们周围到处都是噪声:环境噪声、传输干扰、甚至是周围说话人的噪声,这些噪声不仅会在心理上造成我们的听觉疲劳,而且还会对语音的采集、语音的识别、语音的传输等很多节造成影响,从而使通信系统的性能降低。因此,在很多时候带有噪声的语音在使用前都要进行处理来减弱环境噪声的干扰。其常用的手段包括,噪声补偿、提高语音的抗干扰参数、对带噪的语音进行增强处理等方法,而从背景噪声中提取有用的语音信号[1],并进行降噪处理,是最直接有效的手段,这就是语音增强,其原理框图如图1.1所示。 可以看出,语音增强不仅可以提高语音的质量,使语音听上去更加的自然悦耳,不易产生听觉疲劳,增强听者的体验度;而且可以提高语音的清晰度或者提高语音的可懂度,使语音更容易被理解;除此之外,还可以提高语音处理系统输入信号的信噪比,增强语音信号的抗噪能力,对语音处理系统的其他环节都是有益的[2],是语音处理系统中不可或缺且起到重要作用的一部分。但是由于不同环境下的背景噪声也不同,因此不仅考虑语音的特性、人耳的听觉特性而且还要考虑不同环境下噪声的特性,选择合适的语音增强方法。 虽然人们对语音增强的目的在于改善语音的质量和提高语音的可懂度,但是却无法做到两者兼顾。如果人们致力于去除带噪语音中的噪声成分,使增强后的语音尽可能的接近原始的纯净语音,l 1.2.1语音增强算法的历史与现状 语音增强技术兴起于20世纪60年代,人们开始对语音增强进行全方位的研究和探索,并且开始提出了各种算法应用于语音增强[3]。1978年,Lim和Oppenheim提出了基于维纳滤波(Wiener filter)的语音增强算法,该方法是基于最小均方误差估计平稳时的时域波形[2],可以使残留噪声接近于白噪声,虽然对处理非平稳的语音信号存在问题,但这仍然是人们在语音增强探索中走出的坚实的一步;1979年Boll提出了基于谱相减法(Spectral subtraction)的语音增强算法,该方法原理的是从无声区估计出噪声的功率谱,随后从带噪语音的频谱中滤除噪声谱得到相对纯净的语音谱,方法简单容易实现,现在也被广泛应用,随着该算法的不断深入探究,又不断的提出了改进的谱减法算法[4];1980年,Maulay和Malpass提出了软判决语音去噪算法(Soft-decision noise suppression filter)[5];1984年,Ephraim和Malah提出了基于短时幅度谱估计(Minimum Mean Square Error)的语音增强算法[6];1987年,paliwal提出了卡尔曼滤波法(Kal
原创力文档


文档评论(0)