基于先验知识的语音增强方法研究.doc

下载文档 降价啦

7
0
约10.5万字
约 153页
2016-08-23 发布于贵州
举报
版权申诉
保障服务

基于先验知识的语音增强方法研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于先验知识的语音增强方法研究

博士学位论文基于先验知识的语音增强方法研究现实环境中语音信号往往被各种环境噪声污染。语音增强作为消除噪声和提高语音质量的一种有效手段，尽管近年来取得了长足的进步，但仍不能完全满足实用的要求。本文从先验知识的角度审视语音增强算法，对多种单通道/多通道方法进行了分析总结，并且针对算法应用中存在的缺陷和问题，充分利用语音、噪声和麦克风阵列的先验知识的进行了研究和改进。主要工作和创新点如下：针对传统的谱减法中交叉项被忽略的假设在低信噪比（Signal-to-Noise Ratio, SNR）环境中会造成严重误差的问题，我们提出了一种基于相位调整和幅值补偿的多子带谱减法。首先，利用噪声与语音信号相位短时变化差异性的先验知识，我们提出了基于微距最大值搜索的相位调整算法。其次，考虑到噪声对语音的干扰在各子频带上不一致的先验知识，我们采用了多子带独立的谱减策略。最后，针对不同SNR条件下过减规则对语音谱幅值的差异性衰减的先验知识，我们提出了幅值补偿算法。多通道信号子空间方法的关键在于运用了语音信号的低秩模型，算法的核心是信号子空间维度的估计。针对传统的维度估计方法过分依赖噪声功率估计的问题，我们提出了一种基于F范数的信号子空间维度估计方法。首先，通过训练获得了语音幅值谱的超高斯先验分布模型。其次，利用麦克风之间的相关性和正交变换不改变矩阵F范数的性质，获得了语音互相关矩阵F范数的高斯先验分布模型。最后，利用一种基于最大化原则的估计策略，在接受原假设的前提下最大化信号子空间维度。针对现有的后验语音存在概率（Speech Presence Probability, SPP）估计方法在非平稳噪声环境下高漏报率和高误警率的问题，我们提出了一种基于倒谱平滑和时频相关性的后验SPP估计算法。首先，根据语音的倒谱系数具有区域分布特性的先验知识，我们提出了倒谱系数的选择性平滑策略来估计先验SNR。然后，针对相邻时频点之间的紧密相关性，我们提出了频域多层平均与时域迭代平滑相结合的先验SPP的更新算法。针对现有噪声估计方法在面对变化剧烈（例如具有窄带能量阶跃）的非平稳噪声时跟踪延迟和有偏估计的问题，我们提出了一种基于SPP和频谱稀疏性的时噪声估计算法。首先，利用倒谱平滑策略和时频相关性的先验知识来估计后验SPP。然后，对语音谱的稀疏性进行了描述，通过训练获得稀疏测度的高斯分布模型作为先验知识，通过判断语音SPP估计谱的稀疏性来调整后验SPP估计，从而更快速的跟踪噪声变化。所提算法中先验知识的运用是本文工作的重点和亮点，先验知识主要通过机器学习、理论分析和实验调试获取，以算法规则、分布模型和参数设置的形式表示。对比实验表明，与传统的算法相比所提各算法获得了更优异的性能，达到了预期的研究目的。关键词：语音增强，先验知识，谱减法，信号子空间方法，语音存在概率，噪声估计 Abstract The speech signals are generally immersed in acoustic ambient noise. Although numerous speech enhancement techniques have been proposed to extract the desired speech signal from its corrupted observations, they cannot completely meet the requirements in real application. In this thesis, we investigate a variety of single-\multi-channel speech enhancement algorithms in terms of a priori knowledge. Moreover, in order to overcome the problem and deficiency of the existing algorithms, we research on more generalized a priori knowledge of speech, noise and microphone array, based on which we propose a variety of algorithms to improve the speech quality. The main contributions and novelties include: The traditional spectral subtraction method is based on a priori k