汉语连续语音识别中上下文相关的声韵母建模-read.pdf

下载文档

20
0
约1.57万字
约 4页
2018-06-08 发布于天津
举报
版权申诉
保障服务

汉语连续语音识别中上下文相关的声韵母建模-read.pdf

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

汉语连续语音识别中上下文相关的声韵母建模-read

清华大学学报( 自然科学版)2004 年1 月第44 卷第1 期第61-64 页 J Tsinghua Univ (Sci Tech), Jan. 2004, Vol. 24, No. 1, pp. 61-64 汉语连续语音识别中上下文相关的声韵母建模 1 1,2 1 1 李净，郑方，张继勇，吴文虎 (1. 清华大学计算机科学与技术系智能技术与系统国家重点实验室，北京 100084; 2. 北京得意音通技术有限责任公司，北京 100085) 摘要:声学建模是汉语连续语音识别中的关键步骤之一。 about 24.53% and 41.65%, respectively. More than 20% model 根据汉语语音的特点，采用扩展声韵母（XIF ）作为识别基 size reduction is obtained with little performance deterioration 元，并针对 XIF 基元设计了相应的问题集，利用基于决策 after using the provided methods on Tri-XIF model. 树的状态共享策略建立上下文相关声韵模型（Tri-XIF ）。将 Keywords: Speech Recognition; Decision Tree; Context Tri-XIF 模型与上下文相关音素模型（Tri-phone）、上下文无 Dependent; Initial/Final 关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明，Tri-XIF 模型与声学建模是连续语音识别中声学层面处理的 Tri-phone 模型、音节模型相比，识别性能有了很大提高，关键步骤之一。声学模型用来描述识别基元与其特其音节误识率分别降低了24.53%和41.65% 。采用了所提出征矢量序列之间的对应关系。通过声学建模，可以的优化策略后，模型规模降低20%以上，而性能下降很少。估计待识别特征矢量序列所对应的语音识别基元，关键词：语音识别；决策树；上下文相关；声韵母；从而完成特征矢量序列到语音识别基元的识别转中图分类号: TP493.42 换。近年来，对语音识别的研究重心已经从小词 Context Dependent Initial/Final Acoustic 表、孤立词的研究逐步转向大词表、连续语音识别， Modeling for Chinese Continuous Speech 以及基于连续语音的各种应用。本文研究的就是汉 Recognition 语连续语音中的声学建模，涉及以下内容： 1 1,2 1 LI Jing ，ZHENG Fang ，ZHANG Jiyong ，WU 1）如何利用汉语的发音特点，选择适当的识 1 Wenhu 别基