语音识别系统中的快速搜索算法研究.docx

下载文档

3
0
约3.88千字
约 7页
2021-01-31 发布于天津
举报
版权申诉
保障服务

语音识别系统中的快速搜索算法研究.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

北方工业大学本科毕业设计V论文）开题报告书题目：语音识别系统中的快速搜索算法研究指导教师：专业班级：学号：姓名：日期：2018年3月4日一、选题的目的、意义我国语音识别研究工作起步于五十年代，但近年来发展很快。研究水平也从实验室逐步走向实用。从 1987年开始执行国家863计划后，国家863 智能计算机专家组为语音识别技术研究专门立项，每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步，在汉语语音识别技术上还有自己的特点与优势，并达到国际先进水平。与机器进行语音交流，让机器明白你说什么，这是人们长期以来梦寐以求的事情。语音识别技术就是将人类的语音中的词汇内容转换为计算机可读的输入，例如，二进制编码或者字符序列。语音识别技术的应用可以分为两个发展方向：一个方向是大词汇量连续语音识别系统，主要应用于计算机的听写机，以及与互联网相结合的语音信息查询服务系统，这些系统都是在计算机平台上实现的；另外一个重要的发展方向是小型化、便携式语音产品的应用，如手机上的拨号、汽车设备的语音控制、家电遥控等方面的应用，这些应用系统大都使用专门的硬件系统实现。嵌入式孤立词识别是小型化、便携式语音识别方向的应用热点，拥有较好应用成果，若在此基础上，开发大词量孤立词语音识别系统或中等词汇量连续语音识别系统，不仅使语音识别系统的应用范围扩大，而且令用户得到更好的语音识别体验。搜索时间消耗与词量成正比，为在识别率和识别速度之间寻求合适的平衡点，必须提升系统性能。任何电子设备系统）都是由硬件部分和软件部分组成的，所以只要改进这两部分就能提升成品的性能，但是由于嵌入式平台的苛刻性，即计算机性能和内存资源受限，所以只能考虑改进软件方面，即精炼、修改解码算法，从而提高搜索速度。二、本题的基本内容从语音识别技术诞生以来，识别率就是评价语音识别系统的一个重要指标，随着语音识别技术的实用化，识别系统的速度也成为了和识别率一样重要的评价系统的重要指标，我们都知道，语音识别系统的精度和速度是一对互相矛盾的参数，那么如何能在尽量不影响识别率的前提下提高速度指标是本文研究的一个重点。本文搭建的语音识别系统基于隐马尔可夫模型＜HMM。HMM语音识别的基本原理如图1所示。帧同步维特比束搜索＜Time Synchronous Viterbi Beam Search ) 是目前基于HMM隐马尔可夫模型)的语音识别所广为采用的方法。对于孤立词语音识别，帧同步维特比束搜索的时间消耗与词表规模近似成正比。当词表规模增大到一定程度时， Viterbi搜索将成为识别算法的主要时间消耗因素。所以本文针对 Viterbi 搜索，部分进行了优化算法的研究。基于观察矢量与孤立词识别网络单向有序对应的特点，本文提出了一种基于自动音节切分的束搜索算法。本文先描述了一下该理念的理论基础，因为待识别语音得到的观察矢量是一个线性序列，则该网络 Q与观察矢量序列 E是单向对应的，进行 Viterbi搜索时，若只保留观察矢量序列E的对应段Q,其余路径不予计算, 则可实现基于音节切分的束搜索。该方法无需对路径排序即可实现音节层的剪枝。而后很大的篇幅在讲述本文的重点内容即自动音节切分的束搜索算法的实现，实现的过程概括的分为四步： 1 ）搜索之初，初始化搜索范围即对语音进行切分； 2）对每个音节进行判定，得出分数； 3）将所得分数进行归一化处理； 4）将所得词条与模板一一比对，得出结果。最后将束搜索算法植入预先准备的语音识别系统里，测试束搜索算法的性能，为准确比较束搜索算法的时间性能，测试中不包含特征参数提取、输出概率计算等公共时间开销。三、完成期限和主要措施第1周：收集资料第2周：文献翻译第3周：撰写开题报告第4周：开题答辩第5~6周：制定实施方案第7周：电路设计，编程第8周：中期答辩第9~10周：改进已设计的电路或程序第11~13周：软硬件调试第14周：验收第15周：撰写毕业论文，为毕业答辩做准备第16周：毕业答辩四、预期达到的目标 1、使用matlab编写出可应用的完整的语音搜索算法. 2、在基础搜索语言完成的基础上，增大语音识别系统的词库的词汇量，在不降低识别精度和不增加内存消耗的同时，搜索耗时不增加。五、主要参考文献 [1]荆嘉敏，刘加，刘润生?基于HMM的语音识别技术在嵌入式系统中的应用[J] ? 电子技术应用 ,2003, 10: 12 -14.JING Jiamin, LIU Jia, LIU Run she ng. Applicati onofHMM - based speech recog niti