- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
鲁棒性语音识别模型适应技术的研究
摘 要
语音识别的鲁棒性技术是为解决由于测试环境与训练环境之间的声学失配而
引起识别性能恶化问题,是当今语音技术发展的一个重要方向,其中以并行模型组
合技术(PMC)为代表的模型适应技术在鲁棒性技术中占有重要位置。
本论文在分析了PMC技术的基本原理后,针对PMC技术的局限性等有待改进
的方面,提出了针对性解决办法,包括:卷积噪声的最大似然估计求解方法:对合
成模型动静态矢量采用加权方式处理减少计算量,提高识别率;采用模型分裂组合
技术方法和增加干净语音矢量与噪声矢量的相关项来降低假设和近似处理的不准
确性。
在对PMC技术进一步深入研究的基础上,论文中创新地提出PMC技术的改进
方法:将信号增强 (去噪)技术与环境适应技术相综合。对适应数据与测试数据应
用信号增强技术作为预处理,将有噪数据尽可能还原成干净语音数据;然后应用模
型适应技术,对经增强预处理后的适应数据采用最大似然估计法求估残留的加性与
卷积噪声,使合成的模型 (称为增强语音模型)更好的匹配经预处理后的测试数据。
本文还创新地引入一个新概念:残差噪声模型,将它作为残留的加性噪声和卷积噪
声的联合补偿模型,并直接定义于倒谱域上对语音信号的加性作用,这样不仅通过
增强处理提高了信号的信噪比,而且使PMC技术整个处理在倒谱域上就完成了,
简化和省略了域间转换的过程,克服了传统PMC技术诸多弱点。新的PMC技术可
进一步提高识别性能,增强对环境的适应性。
实验是在剑桥大学的HTK语音识别工具包的基础上进行,嵌入了新的PMC算
法,可用于对0-9十个中文数字组成的数字串进行连续语音识别。在各种噪声环境
下对算法进行了测试,其中包括人工添加噪声以及真实噪声场景,结果表明,新的
PMC技术在各种噪声环境下能显著提高识别率。
t关键词]:PMC技术,增强技术,最大似然估计,残差噪声模型
ABSTRACT
TherobustTechniquestoimprovethebadperformanceduetothemismatch
betweentrainingandtestenvironmentshavebecomeahotspotinthefieldofspeech
recognition.Theenvironmentadaptivemethodsplayimportantpartinimprovingthe
robustness,forexample,PMC(ParallelModeCombination).
Inthedissertation,thefundamentalprincipleofPMCisinvestigatedandthe
limitationisanalyzed:theestimationofconvolutionalnoisemodelremainsanopen
problem;theapproximationsandassumptionsmadeinthePMCarenotaccurateenough;
computationcoststoomuch;performancedegradesinlowerSNR,etc,alllimitthe
applicationofPMC.Thesolutionsareproposedinthisdissertation:theconvolutional
noisemodelsisestimatedbyMaximum likelihood(ML)manner;theweighted
summationofvariancevectorofnoiseandspeechmodelsproducesthevarianceof
combinedmodels,thatcanreducethecomputationcosts;theapproachesof
model-splittingandcombiningestimationofthecross-termbetweenthespeechand
noisecanovercomepartlytheinaccuracyduetotheapproximationsandassumptions.
ThenewPMCisproposedthisdissertation:theenhancementapproachisusedasthe
pre-processingtorestorethenoisyspeechsigna
原创力文档


文档评论(0)