随机轨迹模型中汉语连续语音识别基元的选取方案-东南大学学报
第 卷第 期
29 4 东 南 大 学 学 报 Vol29No4
年 月
1999 7 JOURNALOFSOUTHEASTUNIVERSITY July1999
随机轨迹模型中汉语连续语音识别基元的选取方案
黄心晔 施 嵘 富煜清 陆佶人
(东南大学无线电工程系,南京 210096)
摘 要 在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的
特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元 基于音素基随机
.
轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行.
关键词 识别基元;随机轨迹模型;音素
分类号 TN912.34
[]
1
随机轨迹模型( ,简称 ) 是针对基本隐马尔可夫模型(
stochastictrajectorymodels STM hidden
[]
2
,简称 ) 所隐含的 个不合理假设而提出的统计建模方法 选择什么样的
Markovmodels HMM 3 .
[]
3
语音单元作为识别基元是 语音识别系统训练中的主要问题之一 由于协同发音现象 和
STM .
[]
4
语音本身很强的多变性 给识别基元的选择、提取和训练带来了极大的困难.
1 汉语语音识别基元的选择
语音识别中,识别基元的选取是一个很重要的问题,它直接关系到系统的准识率与扩展
[]
5
性 识别基元的选取应该具备以下要求 : 具有优良的检测一致性; 具有可训练性;
. ① ② ③
用这些基元构成的系统具有较强的鲁棒性.
为了克服协同发音现象以及发音的多变性等困难,最简单的办法是采用词作为识别基元,
文献[]表明,用词作为识别单元可以获得很高的识别率 但是如果要将语音识别系统扩展成
6 .
大词汇量的孤立词、短语或连续语音识别系统时,采用词作为识别基元就遇到了很大困难 首
.
先,为了获得可靠的模型,训练集中出现某个词的次数必须相当大,这样才能够保证词的两端
被很好地建模 其次,由于词汇量增大,词与词之间的区分特征越来越小,整个系统的识别率下
.
降 再者,大词汇量词表的声学内容有很大一部分是重复的,对它们区别处理会带来很大的浪
您可能关注的文档
最近下载
- (正式版)DB1501∕T 0038-2023 《红花生态种植技术规程》.pdf VIP
- 2025年广东中山中考语文试题及答案(word版) .pdf VIP
- 《中国文化概论》张岱年课后习题答案.pdf VIP
- 德阳市中考:2025年-2023年《化学》考试真题与参考答案.pdf
- 公路平面交叉设计细则.docx VIP
- 人教版二年级下册数学全册教学设计(配2026年春改版教材).docx
- 智慧树 知到 大学生爱国教育十讲 章节测试答案.docx VIP
- 2024年广东中山中考语文试题及答案.pdf VIP
- 医院药品采购管理制度细则.docx VIP
- 2《JavaScript初级》教学计划大纲.docx VIP
原创力文档

文档评论(0)