基于声韵母建模基元拼接与整词识别的非特定人孤立词语音识别系统的的研究.pdfVIP

基于声韵母建模基元拼接与整词识别的非特定人孤立词语音识别系统的的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于声韵母建模基元拼接和整词识别的非特定人 孤立词语音识别系统的研究 李峰溺蓟涛李战荣 中国科学院自动化研究所高创中心100080 iaacell {fli,Jtpu,lich}@hitie 摘要 识别时采用基于词树的一遍或多遍路径搜索算法。 本文提出了一种新的基于声韵母建模基元拼接技 该算法的优点是建模精度高。可以适用于较大规模 术的非特定人孤立词语音识别算法,其中声韵母建 的词表,而且使用时无需训练,更改词表方便,有 模基元采用高精度的三音子模型,识别引擎采用以 利于实际应用;缺点是算法复杂,需要的存储空间 声韵母基元拼接的整词模型。该算法与一般的整词 大,而且识别时会引入搜索误差,从而引起识别率 建模算法相比,具有词表改变方便,识别率高的优 的下降『3]。 点:与通常基于声韵母建模和词树搜索的算法相 在本文中我们试圈满足实际中一种重要的需 比,具有搜寻空间小,计算量小的优点。 求:即无需训练的小词表语音识别,对速度、识别 率和词表更改灵活性方面都有很高的要求。我们从 1.引言 整词建模方法和基于声韵母建模、词树搜索的方法 近年来非特定人孤立词语音识别技术0WR)取得了 中获得启发,选择62个声韵母作为模型基元,得 巨大的发展,识别率达到99%以上,而且由于其算 法可以在单片机、DSP等嵌入式系统中实现,是目 表中词}[的声韵母序列拼接成整词模型。识别时采 前最接近实际应用的语音识剐技术。它在智能家居 取通常在整词建模中所采用的模板匹配算法。实验 系统、车载系统以及掌上电脑等领域中有着广泛的 证明该算法识别率高,声韵母模型在采用tfiphone 应用前景。 建模,4状态1混合情况下,达到994%以上,而 目前在非特定人IWR系统中普遍采用两种方 且运算速度快,在20MIPS DSP平台上可以实现词 法:一种是整词建模,整词匹配的方法;一种是基 表规模为200词的实时识别任务。 于声韵母建模和词树搜索的方法。第一种方法把词 本文安排如下;第二部分介绍了模型基元的选 作为建模和识别单元,状态的数目与词所包含的音 取依据和训练方法;第三部分介绍了整词模型的拼 子的数目保持基本一致,一般选择2—10。本文的 接方法及识别算法;第四部分我们给出了实验结 对比实验中由于词的长度基本相同,平均为4个字, 果,并研究了basephone、triphone建模方法,以及 因此模型统一采用8个状态111。在模型训练阶段中 状态、混合教选择对系统性能的影响:第五部分对 采用K均值聚类方法,首先把该词对应的所有训练 我们所做的工作做一总结和展望。 语音平均分成8段以对应于8个状态,计算初始模 型参数,即每个状态的观察数据的均值和方差:再 2.模型基元的选取和训练方法 运用Viterbi算法找到每个训练语音和临时模型匹 我们需要得到的整词模型是由基元模型串接而成, 配的最佳路径,回溯得到语音对应的新的状态序 因此选取台适的基元模型以及训练方法对于系统 列:然后重新计算模型参数.经过3—4迭代即可 的识别率有重大影响,本节就这两方面的内容进行 得到晟终模型。在识别阶段,运用Uiterbi算法计算了详细介绍。 输入语音和所有候选模型的匹配得分,得分中的最 2.1模型基元的选取 丈值所对应的词即为识别结果【2】。整词建模方法的 因为我们希望词表是可变的,因此我们必

文档评论(0)

wuhuaiyu002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档