- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于HTK的命令字识别系统
编号:
毕业设计说明书
题 目: 基于HTK的命令
字识别系统
学 院:
专 业:
学生姓名:
学 号:
指导教师:
职 称: 讲师
题目类型: 理论研究 实验研究 工程设计 工程技术研究 软件开发
年 月 日
摘 要
语音识别技术经过半个世纪的发展,目前已日趋成熟,其在语音拨号系统、数字遥控、工业控制等领域都有了广泛的应用。语音识别技术就是让机器听懂人类的语音并执行相关的动作,是一个研究的热点。数字语音识别是语音识别一个极其重要的分支,其在现实生活中的应用愈加广泛。
由于目前常用的声学模型和语言模型的局限性,计算机只能识别一些词汇或一些句子。语音识别系统在语种改变时,往往会出现错误的识别结果。针对上述问题,结合隐马尔可夫模型原理,在HTK语音处理工具箱的基础上构建了中英文特定词语音识别系统。该系统通过代码控制整个构建过程,使其在更换新的训练数据和词典后能快速生成对应的识别模型。
HTK 是英国剑桥大学开发的一套基于C 语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA 排序等领域。从HTK 的基本原理和软件结构出发,设计了一个基于HTK 的数字语音识别系统,并验证了其识别效率。本文基于隐马尔可夫模型(HMM)的连续语音训练和识别算法理论,结合梅尔频率倒谱系数(MFCC)提取技术,单音素HMM建模技术,基于上下文相关的三音素HMM建模技术以及基于维特比算法的识别技术等一系列技术,利用隐马尔可夫模型工具箱(HTK)构建了基于HTK的连续语音识别实验平台。随后,通过更换识别单元,更改特征参数的维数和增加高斯混合分量的个数来考虑不同因素对系统性能的影响。最后,通过比较试验,验证了识别单元、高斯混合分量的数目以及MFCC 维数的适当组合可提高系统的正确识别率。实验结果表明,随着HMM从单音素建模到三音素建模的转换,测试语句在语句级和字词级的识别率都呈增加的趋势,捆绑三音素后识别率达到稳定状态。
关键词:语音识别;隐马尔可夫模型;隐马尔科夫工具箱;梅尔频率倒谱系数;识别单元
Abstract
Having developed about 50 years, the speech recognition (SR) technique has a wide range of applications inmany fields, such as voice dialing system, digital remote control and industrial control. Speech is an important tool for people to communicate with machines. Digital speech recognition is an extremely important branch of speech recognition. Its application in real lifeis used more and more widely.
But the limitation of acoustic and language model is that the computer can only recognize some words or sentences. When the speech language changes,the system often gets wrong results. To address the problem above, the speech recognition system has been built on the basis of HTK as well as hidden markov model theory. Controlling the building process by code, the system can quickly generate a new recognition model when the training data and dictionary has changed.
HTK is a C language-based toolkit developed by
您可能关注的文档
- 地震剖面的形成.doc
- 地铁监测方案.doc
- 地质灾害搜救通信体系3.doc
- 地震勘探原理期末总复习1(共四部分).doc
- 地震勘探原理期末总复习4(共四部分).doc
- 地震灾后恢复重建城镇基础设施项目城项目可行性申请报告.doc
- 地震地质综合解释.doc
- 地理等值线图专题复习.doc
- 地面绞车房管理制度.doc
- 地震知识.doc
- (4篇)XX区抓党建促基层治理培训心得体会汇编12.docx
- 汇编1154期-在培训班上的讲话汇编(3篇).doc
- 汇编1173期-专题党课讲稿汇编(3篇)112.doc
- 汇编1076期-主题党课讲稿汇编(3篇).doc
- 汇编1177期-学习心得体会汇编(3篇)112.doc
- (6篇)党和国家机构改革心得体会汇编.docx
- 汇编1166期-坚定理想信念、全面从严治党、担当作为专题党课讲稿汇编(3篇)112.doc
- 汇编1174期-专题党课讲稿汇编(3篇)112.doc
- 教育13期-主题教育学习心得体会、研讨发言材料参考汇编(3篇).doc
- 汇编1458期-心得体会研讨发言提纲参考汇编(3篇)123.doc
最近下载
- 露天非煤矿山施工方案.docx VIP
- 标准图集-13G322-1-钢筋混凝土过梁 - 烧结普通砖、蕉压灰砂翩。蒸压粉煤灰砖砌体.pdf
- 危大工程-模板工程及支撑体系-安全管理措施.doc VIP
- 高中历史选择性必修3《文化交流与传播》教学设计(修订版).doc
- 废水处理可行性研究报告.docx VIP
- 统编人教部编版小学语文四年级下册语文第二单元测试卷A(附答案).docx VIP
- GB-55015 空气源热泵技术解读-2024制冷展.pdf
- 2025年郑州旅游职业学院单招职业技能测试题库必考题.docx VIP
- 基于PLC的教室照明自控系统设计.doc
- GB50175-2014 露天煤矿工程质量验收规范.docx
文档评论(0)