基于混合模型的噪声补偿及其在语音识别中的应用-模式识别与智能系统专业论文.docxVIP

下载本文档

1
0
约9.68万字
约 109页
2019-02-19 发布于上海
举报
版权申诉

基于混合模型的噪声补偿及其在语音识别中的应用-模式识别与智能系统专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘摘要当前在纯净环境下采用朗读方式的语音识别系统识别性能已经达到一个相当高的程度，在这种情况下，语音识别走向实际应用必须解决对噪声环境的鲁棒性问题和对说话人本身的鲁棒性问题。本文的研究工作属于前～部分，主要针对加性噪声环境进行鲁棒性研究，提出合适的噪声消除算法，并把这些算法应用到语音识别系统中，提高识别系统在噪声环境下的鲁棒性。本文研究工作主要集中在功率谱域，频域和对数谱域，分析和研究采用混合模型进行噪声消除的算法。论文主要工作和创新点如下： ·在功率谱域，提出采用混合指数模型描述语音周期图分布，并在这个模型基础上构建了最小均方误差估计器实现对纯挣语音能量谱密度的估计。 ●在复频域，提出采用高斯混合模型描述语音频谱分布，给出了语音频谱高斯混合模型构建算法。在这个语音谱高斯混合模型的基础上，本文分别构建了最小均方误差短时谱，幅值平方谱，短时谱幅值和对数谱幅值估计器。此外，本文在最大似然框架下提出了基于这个高斯混合模型的噪声估计算法。 ·对数谱域下实现的对语音特征的补偿是本文最重要的部分。本文在对数谱域的工作包括以下几点：首先提出采用高阶泰勒级数展开实现对对数谱域非线性环境函数的近似以寻求最合适的补偿形式，同时考虑对数谱高斯混合模型的建模精度问题，并且把对能量补偿引入进来，提出采用类似谱减的方法补偿语音能量。此外，本文还提出了把对数能量补偿和对数谱补偿结合在一起进行的方法。由大词汇量连续语音识别的结果可以看出，频域的算法效果比较有限，这是因为这些算法主要是为了增强语音信号本身提出的，性能的提高主要反映在增强效果和小词汇量识别方面。对数谱补偿算法对语音识别系统抗噪声的效果相当明显，因为这是直接对语音特征本身的补偿。本文对对数谱补偿进行了详尽的分析和讨论，大词汇量语音识别的结果远高于噪声环境匹配情况下的识别性能，而后者曾被认为是噪声环境下语音识别性基于混合模型的噪声补偿及其在语音识刷中的应用能的上限。基于混合模型的噪声补偿及其在语音识刷中的应用能的上限。关键词：高斯混合模型，指数分御，能量谱密度，最小均方误差估计对数谱补偿 Abst阳ctNowadays，speech Abst阳ct Nowadays，speech recognition system in cleall conditions with reading input mode call give desimble perfb咖a11ce，but enVi础nmental n01se and sDeal(er variation， such as spontalleousness and accem etc．，prevent tne recogn“ion engine舶m being put to real印plication．This paper deals with tlle f0珊er problem aJld嫡es to explore山e effbctive algorimms to process add“ive environrnental nOise． As a result，the proposed noise reduction algorithms are applied in speech recognition t0 impr0Ve its performance in noisy enVironrnents． The study of me paper is focused in the power spectral domain，t11e complex s口ectral domain and山e 109-spectral domain．The main contributioIls and the main novelties include： ● In ttle power印ectral domain，mixed expOnential model is proposed to describe the dis打ibution of speech p甜odogams．Based on the model，a minimum mean-square error estimator is constructed to estimate speech power spectral density． ● In t}圮complex s_Dectral domain，Gaussian mix“lre model is utilized to model t11e distribution of speech complex spectra and an algo“thnl