- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 38 卷 第3 期 Vol. 38, No. 3
2019 年 5 月 Journal of Applied Acoustics May, 2019
⋄ 研究报告⋄
一种改进的DNN-HMM 的语音识别方法
李云红 梁思程 贾凯莉 张秋铭 宋 鹏 何 琛
王刚毅 李禹萱
(1 西安工程大学电子信息学院 西安 710048)
(2 国网西安供电公司 西安 710032)
摘要 针对深度神经网络与隐马尔可夫模型(DNN-HMM) 结合的声学模型在语音识别过程中建模能力有
限等问题,提出了一种改进的DNN-HMM 模型语音识别算法。首先根据深度置信网络(DBN) 结合深度玻
尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC) 和对数域的Mel 滤波
器组系数(Fbank) 作为声学特征参数,通过TIMIT 语音数据集进行实验。实验结果表明:结合了DBM 的
DNN-HMM 模型相比DNN-HMM 模型更具优势,其中,使用MFCC 声学特征在词错误率与句错误率方面分
别下降了1.26% 和0.20% 。此外,使用默认滤波器组的Fbank 特征在词错误率与句错误率方面分别下降了
0.48% 和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到
21.06% 和3.12% 的好成绩。
关键词 语音识别,深度神经网络,声学模型,声学特征
中图法分类号: TN912.34 文献标识码: A 文章编号: 1000-310X(2019)03-0371-07
DOI: 10.11684/j.issn.1000-310X.2019.03.012
An improved speech recognition method based on DNN-HMM model
LI Yunhong LIANG Sicheng JIA Kaili ZHANG Qiuming SONG Peng
HE Chen WANG Gangyi LI Yuxuan
( School of Electronics and Information, Xi’an Polytechnic University, Xi’an , China)
( State Grid Xi’an Power Supply Company, Xi’an , China)
Abstract The acoustic model combined with deep neural network and hidden Markov model (DNN-HMM)
has been used extensively in today’s speech recognition system. In this paper, an improved DNN-HMM model
speech recognition algorithm is proposed. First, a deep neural network acoustic model is built by the deep
belief network (DBN) and the deep Boltzmann machine (DBM). Then the Mel freque
原创力文档


文档评论(0)