基于HMM模型改进算法的语音识别系统-控制科学与工程专业论文.docxVIP

下载本文档

7
0
约4.68万字
约 70页
2019-01-04 发布于上海
举报
版权申诉

基于HMM模型改进算法的语音识别系统-控制科学与工程专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于HMM模型改进算法的语音识别系统-控制科学与工程专业论文

国内图书分类号：TP391.4 学校代码：10213 国际图书分类号：004.5 密级：公开工学硕士学位论文基于 HMM 模型改进算法的语音识别系统硕士研究生：吴大为导师：林威教授申请学位：工学硕士学科：控制科学与工程所在单位：深圳研究生院答辩日期： 2012 年 12 月授予学位单位：哈尔滨工业大学 Classified Index: TP391.4 U.D.C: 004.5 Dissertation for the Master Degree in Engineering SPEECH RECOGNITION SYSTEM BASED ON AN IMPROVED HMM ALGORITHM Candidate： Wu Dawei Supervisor： Prof. Lin Wei Academic Degree Applied for： Master of Engineering Speciality： Control Science and Engineering Affiliation： Shenzhen Graduate School Date of Defence： December, 2012 Degree-Conferring-Institution： Harbin Institute of Technology 摘要使用生物特征来进行身份辨识的技术是现在学术界的研究热点，而人工智能技术的重要分支之一则是语音识别。语音识别利用了人类语音中的特征参数以及语言的相关性，从而达到了和语音模板库匹配，实现了语音的辨识。相比于图像及其他人工智能技术，语音识别具有快速进行识别、快速人机交互、可扩展性好、硬件依赖度低、学习能力强、实现成本低等优势，因而各类的安防行业以及所有需要身份认证的情形都可以应用到语音识别。而随着未来人工智能技术的发展，语音识别可作为优秀的人机交互接口这一特点也使得其具有无限发展的前景。本文为了提取人体生物特征，首先分析了语音的发声及听觉模型，然后在得到了语音特征参数后利用改进后的隐马尔可夫模型（HMM）训练算法来训练语音数据并建立语音模板，最后识别时再利用了 HMM 的识别算法来进行模板匹配。本文首先研究了语音的发声机理及语音成分的分析，去除了无声段后得到有效语音段。然后根据研究美尔倒谱模型（Mel），得到了符合人耳听觉模型的能表示语音特征的一组参数。并且，本文还通过对比常用于语音识别的 LPC 模型参数，体现了美尔倒谱模型在应用于语音识别上的优势。在为语音特征参数建立模板库及识别的过程中应用了隐马尔科夫模型，本文分析了隐马尔科夫模型的原理及缺陷，提出了改进的隐马尔科夫模型，即引用了遗传算法的随机性使得语音特征参数建立模板库的过程更加具有鲁棒性和准确性。本文以 HTK 语音识别工具为基础，它提供了最基础的隐马尔科夫模型的实现，然后并入了遗传算法工具包 GALib，优化了 Baum-Weich 算法进行语音训练的过程。虽然遗传算法的随机特点会一定地减缓训练过程收敛速度，不过却由于排除了传统隐马尔科夫模型训练算法易于导致局部收敛的弱点，更容易找到全局最优参数，从而使得训练的数据准确性提高，提高了最后使用 Viterbi 算法的识别正确率。关键词：语音识别；美尔频率倒谱系数；隐马尔科夫模型；遗传算法 Abstract One of todays academic research hotspots is the use of biometric technology to identify the identity of human, while speech recognition is an important branch of artificial intelligence technology. Speech recognition uses the correlation between the characteristic parameters and the human voice, as well as the internal relation of language syntax, to achieve a match with a voice template library. Compared to image recognition and other artificial intelligence technologies, voice recognition gains a reputation of quick identification