- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北方工业大学
本科毕业设计(论文)开 题 报 告 书
题 目: 语音识别系统中的快速搜索算法研究
指导教师 :
专业班级:
学 号:
姓 名:
日 期: 2013年3月4日
一、选题的目的、意义
二、本题的基本内容
从语音识别技术诞生以来,识别率就是评价语音识别系统的一个重要指标,随着语音识别技术的实用化,识别系统的速度也成为了和识别率一样重要的评价系统的重要指标,我们都知道,语音识别系统的精度和速度是一对互相矛盾的参数,那么如何能在尽量不影响识别率的前提下提高速度指标是本文研究的一个重点。
本文搭建的语音识别系统基于隐马尔可夫模型(HMM)。HMM 语音识别的基本原理如图 1所示。
帧同步维特比束搜索(Time Synchronous Viterbi Beam Search)是目前基于HMM(隐马尔可夫模型)的语音识别所广为采用的方法。对于孤立词语音识别,帧同步维特比束搜索的时间消耗与词表规模近似成正比。当词表规模增大到一定程度时,Viterbi搜索将成为识别算法的主要时间消耗因素。所以本文针对Viterbi搜索,部分进行了优化算法的研究。基于观察矢量与孤立词识别网络单向有序对应的特点,本文提出了一种基于自动音节切分的束搜索算法。
本文先描述了一下该理念的理论基础,因为待识别语音得到的观察矢量是一个线性序列,则该网络Q与观察矢量序列E是单向对应的,进行Viterbi搜索时,若只保留观察矢量序列E的对应段Q,其余路径不予计算, 则可实现基于音节切分的束搜索。该方法无需对路径排序即可实现音节层的剪枝。而后很大的篇幅在讲述本文的重点内容即自动音节切分的束搜索算法的实现,实现的过程概括的分为四步:
1)搜索之初,初始化搜索范围即对语音进行切分;
2)对每个音节进行判定,得出分数;
3)将所得分数进行归一化处理;
4)将所得词条与模板一一比对,得出结果。
最后将束搜索算法植入预先准备的语音识别系统里,测试束搜索算法的性能,为准确比较束搜索算法的时间性能,测试中不包含特征参数提取、输出概率计算等公共时间开销。 三、完成期限和主要措施
第 1周: 收集资料
第 2周: 文献翻译
第 3周: 撰写开题报告
第 4周: 开题答辩
第5~6周: 制定实施方案
第 7周: 电路设计,编程
第 8周: 中期答辩
第9~10 周: 改进已设计的电路或程序
第11~13周: 软硬件调试
第14周: 验收
第15周: 撰写毕业论文,为毕业答辩做准备
第16周: 毕业答辩 四、预期达到的目标
1、使用matlab编写出可应用的完整的语音搜索算法.
2、在基础搜索语言完成的基础上,增大语音识别系统的词库的词汇量,在不降低识别精度和不增加内存消耗的同时,搜索耗时不增加。
五、主要参考文献
[1] 荆嘉敏, 刘加, 刘润生. 基于 HMM 的语音识别技术在嵌入式系统中的应用 [J] . 电子技术应用, 2003, 10: 12 -14.JING Jiamin, LIU Jia, LIU Runsheng. Application of HMM - based speech recognition on embedded system [J] .Application of Electronic Technology, 2003, 10: 12 -14. ( in Chinese)
[2] 黄昆. 嵌入式, 语音识别技术新趋向 [J] . 中国计算机用户2006, 45: 46.
H UANG Kun. Embedded, new trend of speech recognition [J] . China Computer Users, 2006, 45: 46. ( in Chinese)
[3] 刘斌, 杜利民, 谢凌云. 嵌入式语音识别系统性能分析 [J] .微计算机应用, 2008, 29( 7) : 52 -55.LIU Bin, DU Limin, XIE Lingyun. Performa
文档评论(0)