一种改进的DNN-HMM的语音识别方法-应用声学.PDF

下载文档

83
0
约2.44万字
约 7页
2019-07-05 发布于天津
举报
版权申诉
保障服务

一种改进的DNN-HMM的语音识别方法-应用声学.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第 38 卷第3 期 Vol. 38, No. 3 2019 年 5 月 Journal of Applied Acoustics May, 2019 ⋄ 研究报告⋄ 一种改进的DNN-HMM 的语音识别方法李云红梁思程贾凯莉张秋铭宋鹏何琛王刚毅李禹萱 (1 西安工程大学电子信息学院西安 710048) (2 国网西安供电公司西安 710032) 摘要针对深度神经网络与隐马尔可夫模型(DNN-HMM) 结合的声学模型在语音识别过程中建模能力有限等问题，提出了一种改进的DNN-HMM 模型语音识别算法。首先根据深度置信网络(DBN) 结合深度玻尔兹曼机(DBM)，建立深度神经网络声学模型，然后提取梅尔频率倒谱系数(MFCC) 和对数域的Mel 滤波器组系数(Fbank) 作为声学特征参数，通过TIMIT 语音数据集进行实验。实验结果表明：结合了DBM 的 DNN-HMM 模型相比DNN-HMM 模型更具优势，其中，使用MFCC 声学特征在词错误率与句错误率方面分别下降了1.26% 和0.20% 。此外，使用默认滤波器组的Fbank 特征在词错误率与句错误率方面分别下降了 0.48% 和0.82%，并且适量增加滤波器组可以降低错误率。总之，研究取得句错误率与词错误率分别降低到 21.06% 和3.12% 的好成绩。关键词语音识别，深度神经网络，声学模型，声学特征中图法分类号: TN912.34 文献标识码: A 文章编号: 1000-310X(2019)03-0371-07 DOI: 10.11684/j.issn.1000-310X.2019.03.012 An improved speech recognition method based on DNN-HMM model LI Yunhong LIANG Sicheng JIA Kaili ZHANG Qiuming SONG Peng HE Chen WANG Gangyi LI Yuxuan ( School of Electronics and Information, Xi’an Polytechnic University, Xi’an , China) ( State Grid Xi’an Power Supply Company, Xi’an , China) Abstract The acoustic model combined with deep neural network and hidden Markov model (DNN-HMM) has been used extensively in today’s speech recognition system. In this paper, an improved DNN-HMM model speech recognition algorithm is proposed. First, a deep neural network acoustic model is built by the deep belief network (DBN) and the deep Boltzmann machine (DBM). Then the Mel freque