基于NPC和改进的MFCC鲁棒语音特征提取研究-计算机科学与技术专业论文.docxVIP

下载本文档

1
0
约5.48万字
约 62页
2019-02-15 发布于上海
举报
版权申诉

基于NPC和改进的MFCC鲁棒语音特征提取研究-计算机科学与技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于NPC和改进的MFCC鲁棒语音特征提取研究摘要基于NPC和改进的MFCC鲁棒语音特征提取研究摘要语音识别在实验室环境中已取得了令人满意的效果，但当运用到实际环境时却往往出现识别率显著下降的情况，如何提高噪声环境下的语音识别鲁棒性是当今语音识别研究中最为重要的问题。本文针对语音识别前端处理中的鲁棒性语音特征提取技术展开研究，分别从时域和频域两个方面出发，并结合人类发声特点和人耳听觉特性对已有的特征进行改进，提出了两种具有较好鲁棒性的语音特征提取方法。首先，本文提出采用神经网络进行非线性预测的时域特征提取方法，针对神经网络预测存在大量待估计参数的问题，通过线性预测方法中的最小均方误差原理，减少了估计参数的数目，实现了鲁棒性较高的特征提取。实验表明，在多种信噪比下，与线性预测编码系数(Linear Predictive Coding，LPC)和梅尔频率倒谱系数(Mel．Frequency Cepstral Coefficients，MFCC)特征相比有更好的鲁棒性。其次，针对传统MFCC的离散余弦变换(Discrete Cosine Transform，DCT)在语音信息表达方面存在的缺陷，采用具有更好表征能力的独立成分分析法 (Independent Component Analysis，ICA)对离散余弦变换进行替换，提出了一种新的特征提取方法。实验表明，新的提取方法显著增强了改进后特征对语音特性的表达能力，在相同信噪比下比传统MFCC特征具有更好的鲁棒性；同时，为减少识别中出现的插入错误，引入了Hermansky提出的相对谱滤波技术，实验结果表明，与传统MFCC及ICA改进的MFCC相比，结合相对谱滤波技术的新方法显著减少了插入错误，且保持较高的词识别率；与传统感知线性预测(Perceptual Linear Predictive，PLP)及相对谱滤波改进的PLP相比，词识别率提升很多且去除插入错误的词识别率相差很小。关键词：语音特征提取；非线性预测：BP神经网络；ICA变换；RASTA滤波 Ⅱ 硕上学位论文Abstract 硕上学位论文 Abstract Speech reognition has achieved satisfactory results in laboratory，however，when applied to the reality world，its recognition rate often declines drastically．How to improve the robustness of speech recognition system，under different noise environments，is one of the most important issues in the research on speech recogniton．This paper mainly focused on the robustness of the front—end processing in speech recogntion———speech features extraction．Through analyzing the exsisted features from both the time and frequency domain，and combining with the characteristics of the human voice and auditory properties，tWO kinds feature extraction methods were proposed which possess better robustness． Firstly，a new nonlinear feature extraction method which adopted accuracy artificial neural network instead of traditional linear prediction method was proposed． Using the theory of minimum mean squared error that is used by a linear prediction method，the sum of to be estimated parameters which was very large in the artificial neural network reduces greatly and higher robustness is achi