- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于先验知识的语音增强方法研究
博士学位论文
基于先验知识的语音增强方法研究
现实环境中语音信号往往被各种环境噪声污染。语音增强作为消除噪声和提高语音质量的一种有效手段,尽管近年来取得了长足的进步,但仍不能完全满足实用的要求。本文从先验知识的角度审视语音增强算法,对多种单通道/多通道方法进行了分析总结,并且针对算法应用中存在的缺陷和问题,充分利用语音、噪声和麦克风阵列的先验知识的进行了研究和改进。主要工作和创新点如下:
针对传统的谱减法中交叉项被忽略的假设在低信噪比(Signal-to-Noise Ratio, SNR)环境中会造成严重误差的问题,我们提出了一种基于相位调整和幅值补偿的多子带谱减法。首先,利用噪声与语音信号相位短时变化差异性的先验知识,我们提出了基于微距最大值搜索的相位调整算法。其次,考虑到噪声对语音的干扰在各子频带上不一致的先验知识,我们采用了多子带独立的谱减策略。最后,针对不同SNR条件下过减规则对语音谱幅值的差异性衰减的先验知识,我们提出了幅值补偿算法。
多通道信号子空间方法的关键在于运用了语音信号的低秩模型,算法的核心是信号子空间维度的估计。针对传统的维度估计方法过分依赖噪声功率估计的问题,我们提出了一种基于F范数的信号子空间维度估计方法。首先,通过训练获得了语音幅值谱的超高斯先验分布模型。其次,利用麦克风之间的相关性和正交变换不改变矩阵F范数的性质,获得了语音互相关矩阵F范数的高斯先验分布模型。最后,利用一种基于最大化原则的估计策略,在接受原假设的前提下最大化信号子空间维度。
针对现有的后验语音存在概率(Speech Presence Probability, SPP)估计方法在非平稳噪声环境下高漏报率和高误警率的问题,我们提出了一种基于倒谱平滑和时频相关性的后验SPP估计算法。首先,根据语音的倒谱系数具有区域分布特性的先验知识,我们提出了倒谱系数的选择性平滑策略来估计先验SNR。然后,针对相邻时频点之间的紧密相关性,我们提出了频域多层平均与时域迭代平滑相结合的先验SPP的更新算法。
针对现有噪声估计方法在面对变化剧烈(例如具有窄带能量阶跃)的非平稳噪声时跟踪延迟和有偏估计的问题,我们提出了一种基于SPP和频谱稀疏性的时噪声估计算法。首先,利用倒谱平滑策略和时频相关性的先验知识来估计后验SPP。然后,对语音谱的稀疏性进行了描述,通过训练获得稀疏测度的高斯分布模型作为先验知识,通过判断语音SPP估计谱的稀疏性来调整后验SPP估计,从而更快速的跟踪噪声变化。
所提算法中先验知识的运用是本文工作的重点和亮点,先验知识主要通过机器学习、理论分析和实验调试获取,以算法规则、分布模型和参数设置的形式表示。对比实验表明,与传统的算法相比所提各算法获得了更优异的性能,达到了预期的研究目的。
关键词:语音增强,先验知识,谱减法,信号子空间方法,语音存在概率,噪声估计
Abstract
The speech signals are generally immersed in acoustic ambient noise. Although numerous speech enhancement techniques have been proposed to extract the desired speech signal from its corrupted observations, they cannot completely meet the requirements in real application. In this thesis, we investigate a variety of single-\multi-channel speech enhancement algorithms in terms of a priori knowledge. Moreover, in order to overcome the problem and deficiency of the existing algorithms, we research on more generalized a priori knowledge of speech, noise and microphone array, based on which we propose a variety of algorithms to improve the speech quality. The main contributions and novelties include:
The traditional spectral subtraction method is based on a priori k
您可能关注的文档
- 基于jQuery框架的毕业设计管理系统的设计与实现中.doc
- 基于JSP的在线购物中购物车的设计与实现的设计论文--122163176.doc
- 基于JSP的校园招聘网站设计(含全套CAD图纸).doc
- 基于Lucene的校园搜索系统开发论文.doc
- 基于Mastercam的收音机上壳的模具设计与加工 毕业设计.doc
- 基于MATLAB的三相正弦波变频电源的设计.doc
- 基于MATLAB的交流电动机调速系统仿真与分析.docx
- 基于MATLAB的汽车减震系统仿真建模.docx
- 基于MATLAB的连续时间信号傅里叶级数分析及实现论文--181648294.doc
- 基于MATLAB的逆变电源研究(含完整程序 中英文翻译).doc
- 基于冲动性购买的零售商场促销策略研究word格式.doc
- 基于单片机 SPCE061A的数字电子钟毕业设计--158961893.doc
- 基于单片机 SPCE061A的数字电子钟毕业设计.doc
- 基于单片机16_16的点阵显示毕业设计1.doc
- 基于单片机89C51控制的温度智能控制系统设计.doc
- 基于单片机AMEGA16 AVR数控直流电源的设计.doc
- 基于单片机C语言的巡线小车设计论文.doc
- 基于单片机实现的数字转速表的设计毕业设计(论文)word格式.doc
- 基于单片机实现的空调温度自动控制系统的设计毕业设计(论文)--178647280.doc
- 基于单片机实现的计算器模拟系统设计毕业设计(论文)word格式--105471188.doc
文档评论(0)