基于HTK的命令字识别系统.doc

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于HTK的命令字识别系统

编号: 毕业设计说明书 题 目: 基于HTK的命令 字识别系统 学 院: 专 业: 学生姓名: 学 号: 指导教师: 职 称: 讲师 题目类型: 理论研究 实验研究 工程设计 工程技术研究 软件开发 年 月 日 摘 要 语音识别技术经过半个世纪的发展,目前已日趋成熟,其在语音拨号系统、数字遥控、工业控制等领域都有了广泛的应用。语音识别技术就是让机器听懂人类的语音并执行相关的动作,是一个研究的热点。数字语音识别是语音识别一个极其重要的分支,其在现实生活中的应用愈加广泛。 由于目前常用的声学模型和语言模型的局限性,计算机只能识别一些词汇或一些句子。语音识别系统在语种改变时,往往会出现错误的识别结果。针对上述问题,结合隐马尔可夫模型原理,在HTK语音处理工具箱的基础上构建了中英文特定词语音识别系统。该系统通过代码控制整个构建过程,使其在更换新的训练数据和词典后能快速生成对应的识别模型。 HTK 是英国剑桥大学开发的一套基于C 语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA 排序等领域。从HTK 的基本原理和软件结构出发,设计了一个基于HTK 的数字语音识别系统,并验证了其识别效率。本文基于隐马尔可夫模型(HMM)的连续语音训练和识别算法理论,结合梅尔频率倒谱系数(MFCC)提取技术,单音素HMM建模技术,基于上下文相关的三音素HMM建模技术以及基于维特比算法的识别技术等一系列技术,利用隐马尔可夫模型工具箱(HTK)构建了基于HTK的连续语音识别实验平台。随后,通过更换识别单元,更改特征参数的维数和增加高斯混合分量的个数来考虑不同因素对系统性能的影响。最后,通过比较试验,验证了识别单元、高斯混合分量的数目以及MFCC 维数的适当组合可提高系统的正确识别率。实验结果表明,随着HMM从单音素建模到三音素建模的转换,测试语句在语句级和字词级的识别率都呈增加的趋势,捆绑三音素后识别率达到稳定状态。 关键词:语音识别;隐马尔可夫模型;隐马尔科夫工具箱;梅尔频率倒谱系数;识别单元 Abstract Having developed about 50 years, the speech recognition (SR) technique has a wide range of applications inmany fields, such as voice dialing system, digital remote control and industrial control. Speech is an important tool for people to communicate with machines. Digital speech recognition is an extremely important branch of speech recognition. Its application in real lifeis used more and more widely. But the limitation of acoustic and language model is that the computer can only recognize some words or sentences. When the speech language changes,the system often gets wrong results. To address the problem above, the speech recognition system has been built on the basis of HTK as well as hidden markov model theory. Controlling the building process by code, the system can quickly generate a new recognition model when the training data and dictionary has changed. HTK is a C language-based toolkit developed by

文档评论(0)

kakaxi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档