随机轨迹模型中汉语连续语音识别基元的选取方案-东南大学学报.PDF

下载文档

8
0
约 4页
2017-08-04 发布于天津
举报
保障服务

随机轨迹模型中汉语连续语音识别基元的选取方案-东南大学学报.PDF

随机轨迹模型中汉语连续语音识别基元的选取方案-东南大学学报

第卷第期２９４东南大学学报Ｖｏｌ２９Ｎｏ４年月１９９９７ＪＯＵＲＮＡＬＯＦＳＯＵＴＨＥＡＳＴＵＮＩＶＥＲＳＩＴＹＪｕｌｙ１９９９  随机轨迹模型中汉语连续语音识别基元的选取方案 黄心晔施嵘富煜清陆佶人（东南大学无线电工程系，南京２１００９６）摘要在比较各种汉语语音识别基元的基础上，结合汉语语音和随机轨迹模型的特色，提出了以音素类单元作为汉语连续语音识别系统的识别基元基于音素基随机．轨迹模型的汉语连续语音识别系统的实验结果表明，该方案可行．关键词识别基元；随机轨迹模型；音素分类号ＴＮ９１２．３４［］１随机轨迹模型（，简称）是针对基本隐马尔可夫模型（ｓｔｏｃｈａｓｔｉｃｔｒａｊｅｃｔｏｒｙｍｏｄｅｌｓＳＴＭｈｉｄｄｅｎ［］２，简称）所隐含的个不合理假设而提出的统计建模方法选择什么样的ＭａｒｋｏｖｍｏｄｅｌｓＨＭＭ３．［］３语音单元作为识别基元是语音识别系统训练中的主要问题之一由于协同发音现象和ＳＴＭ．［］４语音本身很强的多变性给识别基元的选择、提取和训练带来了极大的困难．１汉语语音识别基元的选择语音识别中，识别基元的选取是一个很重要的问题，它直接关系到系统的准识率与扩展［］５性识别基元的选取应该具备以下要求：具有优良的检测一致性；具有可训练性；． ① ② ③ 用这些基元构成的系统具有较强的鲁棒性．为了克服协同发音现象以及发音的多变性等困难，最简单的办法是采用词作为识别基元，文献［］表明，用词作为识别单元可以获得很高的识别率但是如果要将语音识别系统扩展成６．大词汇量的孤立词、短语或连续语音识别系统时，采用词作为识别基元就遇到了很大困难首．先，为了获得可靠的模型，训练集中出现某个词的次数必须相当大，这样才能够保证词的两端被很好地建模其次，由于词汇量增大，词与词之间的区分特征越来越小，整个系统的识别率下．降再者，大词汇量词表的声学内容有很大一部分是重复的，对它们区别处理会带来很大的浪

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

随机轨迹模型中汉语连续语音识别基元的选取方案-东南大学学报.PDF