- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音识别中的环补偿研究
北京邮IU人学博I’学位论且= 语哿识别中的王;i卜境孙偿研究
语音识别中的环境补偿研究
摘要
语音识别技术虽然经过多年的积累已经得到很大的发展,但
是还存在诸多问题,特别是语音识别系统环境鲁棒性问题已经严
重制约了语音识别系统的应用和发展。如何使系统不受周围环境
噪声的影响,提高系统的鲁棒性,已经成为亟待解决的关键问题
之一。目前的一些鲁棒性环境补偿方法具体可分为两大类:前端
处理方法和后端(声学模型)处理方法。近年来,基于统计模型
的环境补偿方法受到极大的关注,已经成功运用于前端和后端处
理中。本文将在搭建的非特定人大词汇量连续语音识别系统平台
上,对这种环境补偿方法进行深入的研究。所使用的连续语音识
别系统由以下三个开源工具构筑:剑桥大学开发的HTK声学模型
训练工具、卡内基梅隆大学和剑桥大学联合开发的
IPA(1nfomlation—tecllll010科Promotion
别器。
本文的具体工作与创新包括以下几个方面:
l、对噪声干扰的过程进行了深入的研究,建立了时域、频域、
对数谱域和倒谱域环境模型。
2、构筑了基于batch
EM噪声估计的特征补偿算法。针对两种定
义不同的EM辅助函数,从Bayes理论出发,推导了两种不同的
基于MAP的batchEM算法。
3、采用了基于sequentialEM噪声估计方法的特征补偿算法,解
决了语音识别系统在非平稳环境下的环境鲁棒性问题。假设噪声
环境的先验信息服从单一高斯分布,sequentialEM噪声估计方法
也可以在MAP框架下展开。
4、提出了~种基于多次解码技术的声学模型补偿方法,解决了
语音识别系统声学模型鲁棒性问题。该方法是建立在解码结果
上,通过解码获取纯净语音模型,利用基于Hl订M和MAP的batch
EM算法估计出噪声参数模型。多次解码和多次噪声估计可以使
纯净模型和噪声模型更加精确,从而进一步提高合成的含噪声学
模型的质量和解码输出结果。
5、对声学模型补偿技术做进一步深入的研究,将本文所采.}=}j的
特征补偿算法运用于基于多次解码的声学模型补偿方法的第一
次解码中,提高第一次解码结果和噪声初始值的精度,因此该方
法可以进一步提高噪声估计的准确性,保证合成的含噪声学模型
更加符合当前的噪声环境,从而加快识别结果的收敛速度和精
度。实验表明该方法极大地降低了计算复杂度,用尽可能少的解
码次数获取更高的识别性能。
6、针对声学模型补偿技术存在动态肼M倒谱参数补偿困难的
问题,本文提出了一种混合补偿的方法,即对上面改进型的方法
作了进一步改进,将本文所提出的特征补偿与声学模型补偿方法
进一步有效地结合起来,并将其运用到随后的(第二次及其以后)
的解码中,利用后者补偿静态m心压倒谱参数,利用前者补偿动
态倒谱特征参数,从而实现静动补偿的目的,保证特征序列和声
学模型相匹配。
关键词:鲁棒语音识别、特征补偿、声学模型补偿、最大后验概率
(MAP)估计、最大似然(ML)估计
北京邮电大学博上学位论文 语音识别中的环境补偿研究
COⅣ巴ENSATl0N
ENVIRoNMENT
FORSPEECHRECOGNITION
ABSTRACT
fastaRer
Althou曲speechrecognitiontecIllliquedevelops many
are tobesolved
years’researc
文档评论(0)