语音识别前端噪鲁棒性方法研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音识别前端噪鲁棒性方法研究

中N科学技术大学硕士学怔论文 摘要 本论文的研究课题是语音U{别前端噪声鲁棒性。语音识别是使训算机能够听懂人的语言 的技术,经过数十年的发展,目前已经有小少语音识别系统在实验帑环境下能够给出令人相 当满意的性能。但是,当把这些系统放到实际环境下来使用时,由j:总是存在着的复杂多变 的噪声以及干扰,系统性能往往会发生人幅度的F降,甚至变得完全不具有兀J‘用性。寻找能 够有效的消除或者抑制噪声的方法、提升噪声环境下语音识别系统的性能,已经成为语占识 别实用化过程当中最需要解决的问题之一。 噪声鲁棒性方法非常多样.但大体上nJ以将它们分为酊端方法和后端方法两个大类。前 者着晕于划输入语音信号或者语音特征做处理,以尽可能抑制噪声的影响;后者则丰婴蔚眼 J:使语音识别模型具有更大的宽容度币l适应能力,能够容忍一定量噪声的存在.或者是可以 及时跟上噪声环境的变化。本文对前端噪声鲁棒性方法进行了一系列耐I:究,实现了一些既有 的方法.同时也提出了一些新的方法。 在奉文第■章中,作着介绍了…欧洲电信标准化组织(ETSI)颁布的分布武语占识别 (DSR)fi口端标准。这个标准是ETSI针对分布式语音识别应用『_卜的特征参数提取过程的需求 而制定的,代表着业界存噪声鲁棒性语音识别方面的较高水准。作者较为详细帕介绍了这个 标准的结构以及流程,并结合实验阐述了该标准所采用的几个关键算法的原理。 在奉文第三章巾。作者提出了一个对ETSIDSR标准的改进。在对原标准的实现与研究 过艉d叶1。作者发现其主体算法——两级维纳滤波算法存算法效率方面存在一些问翘,算法巾 反复的时频域转换消耗了人攮帕运算资源。对此,作者进行了深入的理论分析与相关实验, 并提m了一种对缘算法的改进。实验表明.在儿乎不影响标准性能的情况下.使Hj新的算法 丌J以将运算复杂度降低到J糸标准的三分之一左』h 柱本文第四章中,作者介绍了以倒谱均值相减(CMS)、倒谱均值与方茆规接(CMVN)和 直方幽均衡(HQ)等为代表的一类特征参数规整方法。这也是一类廿常重要并且非常常川的 噪卢鲁捧性语音识别方法。本文尝试将尽可能多的这一类方法,都统一到累计分布函数匹配 的缺点之后,作者提出了基于双高斯的特征参数规整力法。与CMS、CMVN等丰廿比.新乃 法可以更为细致的表达语音特扯的概率分布;Ⅲ与HQ相比,新方法又是一个参数化的方法。 在评测用数抛库Aurora2上的相关实验表甥新方浊nj以取得比CMVN等方法更好的性能。 在本文第五章中,作煮介绍了以双通道逐帧线性环境补偿(SPLICE)方法为代表的。类倒 谱参数域特征补偿算法。SPLICE是在最近儿年中被提出柬的一种性能相当不错的力法,它 继承了CDCN等方法的基木原理,町以直接存倒谱参数域中对带噪语音特征进行补偿。该 方法的‘个特点是通常需要刚到双通道数据来建.讧特征『ⅡJ『『J映射补偿关系。作者在Aurora2 任务上实现了SPLICE方法。并墩得了与文献所述相当的性能。 关键词: 语肯tI{别,噪声鲁棒性,语肯tI{别前端,维纳滤波,特征参数规整,倒谱域 特征参数补偿 中H科学技术大学硕士学位论文 Abstract Abstract Thisthesisisfocusedontheresearchofnoise-robustfront.endofautomatic topic speech tries isa that tomake understandthehuman recognition(ASm.ASRtechnology computers forseveral are alotofASR thatcall speech.ARerresearching decades,therealreadyquite systems in

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档