语音识别前端噪鲁棒性方法研究.pdfVIP

下载本文档

6
0
约 72页
2016-01-13 发布于四川
举报
版权申诉

语音识别前端噪鲁棒性方法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音识别前端噪鲁棒性方法研究

中N科学技术大学硕士学怔论文摘要本论文的研究课题是语音U{别前端噪声鲁棒性。语音识别是使训算机能够听懂人的语言的技术，经过数十年的发展，目前已经有小少语音识别系统在实验帑环境下能够给出令人相当满意的性能。但是，当把这些系统放到实际环境下来使用时，由j：总是存在着的复杂多变的噪声以及干扰，系统性能往往会发生人幅度的F降，甚至变得完全不具有兀J‘用性。寻找能够有效的消除或者抑制噪声的方法、提升噪声环境下语音识别系统的性能，已经成为语占识别实用化过程当中最需要解决的问题之一。噪声鲁棒性方法非常多样．但大体上nJ以将它们分为酊端方法和后端方法两个大类。前者着晕于划输入语音信号或者语音特征做处理，以尽可能抑制噪声的影响；后者则丰婴蔚眼 J：使语音识别模型具有更大的宽容度币l适应能力，能够容忍一定量噪声的存在．或者是可以及时跟上噪声环境的变化。本文对前端噪声鲁棒性方法进行了一系列耐I：究，实现了一些既有的方法．同时也提出了一些新的方法。在奉文第■章中，作着介绍了…欧洲电信标准化组织(ETSI)颁布的分布武语占识别 (DSR)fi口端标准。这个标准是ETSI针对分布式语音识别应用『_卜的特征参数提取过程的需求而制定的，代表着业界存噪声鲁棒性语音识别方面的较高水准。作者较为详细帕介绍了这个标准的结构以及流程，并结合实验阐述了该标准所采用的几个关键算法的原理。在奉文第三章巾。作者提出了一个对ETSIDSR标准的改进。在对原标准的实现与研究过艉d叶1。作者发现其主体算法——两级维纳滤波算法存算法效率方面存在一些问翘，算法巾反复的时频域转换消耗了人攮帕运算资源。对此，作者进行了深入的理论分析与相关实验，并提m了一种对缘算法的改进。实验表明．在儿乎不影响标准性能的情况下．使Hj新的算法丌J以将运算复杂度降低到J糸标准的三分之一左』h 柱本文第四章中，作者介绍了以倒谱均值相减(CMS)、倒谱均值与方茆规接(CMVN)和直方幽均衡(HQ)等为代表的一类特征参数规整方法。这也是一类廿常重要并且非常常川的噪卢鲁捧性语音识别方法。本文尝试将尽可能多的这一类方法，都统一到累计分布函数匹配的缺点之后，作者提出了基于双高斯的特征参数规整力法。与CMS、CMVN等丰廿比．新乃法可以更为细致的表达语音特扯的概率分布；Ⅲ与HQ相比，新方法又是一个参数化的方法。在评测用数抛库Aurora2上的相关实验表甥新方浊nj以取得比CMVN等方法更好的性能。在本文第五章中，作煮介绍了以双通道逐帧线性环境补偿(SPLICE)方法为代表的。类倒谱参数域特征补偿算法。SPLICE是在最近儿年中被提出柬的一种性能相当不错的力法，它继承了CDCN等方法的基木原理，町以直接存倒谱参数域中对带噪语音特征进行补偿。该方法的‘个特点是通常需要刚到双通道数据来建．讧特征『ⅡJ『『J映射补偿关系。作者在Aurora2 任务上实现了SPLICE方法。并墩得了与文献所述相当的性能。关键词：语肯tI{别，噪声鲁棒性，语肯tI{别前端，维纳滤波，特征参数规整，倒谱域特征参数补偿中H科学技术大学硕士学位论文 Abstract Abstract Thisthesisisfocusedontheresearchofnoise-robustfront．endofautomatic topic speech tries isa that tomake understandthehuman recognition(ASm．ASRtechnology computers forseveral are alotofASR thatcall speech．ARerresearching decades，therealreadyquite systems in