- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北方工业大学本科毕业设计V论文)开题报告书
题 目:语音识别系统中的快速搜索算法研究
指导教师:
专业班级:
学号:
姓名:
日期:2018年3月4日
一、选题的目的、意义
我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平 也从实验室逐步走向实用。从 1987年开始执行国家863计划后,国家863 智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语 音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有 自己的特点与优势,并达到国际先进水平。
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以 求的事情。语音识别技术就是将人类的语音中的词汇内容转换为计算机可读 的输入,例如,二进制编码或者字符序列。语音识别技术的应用可以分为两 个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的 听写机,以及与互联网相结合的语音信息查询服务系统,这些系统都是在计 算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的 应用,如手机上的拨号、汽车设备的语音控制、家电遥控等方面的应用,这 些应用系统大都使用专门的硬件系统实现。
嵌入式孤立词识别是小型化、便携式语音识别方向的应用热点,拥有较 好应用成果,若在此基础上,开发大词量孤立词语音识别系统或中等词汇量 连续语音识别系统,不仅使语音识别系统的应用范围扩大,而且令用户得到 更好的语音识别体验。搜索时间消耗与词量成正比,为在识别率和识别速度 之间寻求合适的平衡点,必须提升系统性能。任何电子设备 系统)都是由
硬件部分和软件部分组成的,所以只要改进这两部分就能提升成品的性能, 但是由于嵌入式平台的苛刻性,即计算机性能和内存资源受限,所以只能考 虑改进软件方面,即精炼、修改解码算法,从而提高搜索速度。
二、本题的基本内容
从语音识别技术诞生以来,识别 率就是评价语音识别系统的一个重要 指标,随着语音识别技术的实用化, 识别系统的速度也成为了和识别率一 样重要的评价系统的重要指标,我们 都知道,语音识别系统的精度和速度 是一对互相矛盾的参数,那么如何能 在尽量不影响识别率的前提下提高速 度指标是本文研究的一个重点。
本文搭建的语音识别系统基于隐 马尔可夫模型<HMM。HMM语音识别 的基本原理如图1所示。
帧同步维特比束搜索<Time
Synchronous Viterbi Beam Search ) 是目前基于HMM隐马尔可夫模型)的 语音识别所广为采用的方法。对于孤 立词语音识别,帧同步维特比束搜索 的时间消耗与词表规模近似成正比。 当词表规模增大到一定程度时, Viterbi搜索将成为识别算法的主要时 间消耗因素。所以本文针对 Viterbi 搜索,部分进行了优化算法的研究。 基于观察矢量与孤立词识别网络单向 有序对应的特点,本文提出了一种基于 自动音节切分的束搜索算法。
本文先描述了一下该理念的理论 基础,因为待识别语音得到的观察矢 量是一个线性序列,则该网络 Q与观
察矢量序列 E是单向对应的,进行 Viterbi搜索时,若只保留观察矢量序 列E的对应段Q,其余路径不予计算, 则可实现基于音节切分的束搜索。该 方法无需对路径排序即可实现音节层 的剪枝。而后很大的篇幅在讲述本文 的重点内容即自动音节切分的束搜索 算法的实现,实现的过程概括的分为 四步:
1 )搜索之初,初始化搜索范围 即对语音进行切分;
2) 对每个音节进行判定,得出 分数;
3) 将所得分数进行归一化处 理;
4) 将所得词条与模板一一比 对,得出结果。
最后将束搜索算法植入预先准备的语 音识别系统里,测试束搜索算法的性 能,为准确比较束搜索算法的时间性 能,测试中不包含特征参数提取、输 出概率计算等公共时间开销。
三、 完成期限和主要措施
第1周:收集资料
第2周:文献翻译
第3周:撰写开题报告
第4周:开题答辩
第5~6周:制定实施方案
第7周:电路设计,编程
第8周:中期答辩
第9~10周:改进已设计的电路或程序
第11~13周:软硬件调试
第14周: 验收
第15周:撰写毕业论文,为毕业答辩 做准备
第16周: 毕业答辩
四、 预期达到的目标
1、 使用matlab编写出可应用的完整的语音搜索算法.
2、 在基础搜索语言完成的基础上,增大语音识别系统的词库的词汇量,在不 降低识别精度和不增加内存消耗的同时,搜索耗时不增加。
五、主要参考文献
[1]荆嘉敏,刘加,刘润生?基于HMM的语音识别技术在嵌入式系统中的应 用[J] ? 电子技术应用 ,2003, 10: 12 -14.JING Jiamin, LIU Jia, LIU
Run she ng. Applicati onofHMM - based speech recog niti
文档评论(0)