- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
非特定人连续语音识别的理论、分析和实验
摘要
非特定人连续汉语数字语音识别在电话语音网关、家电遥控、工业
控制、信息查询系统等领域有着广泛的应用,无论在小词表语音识别
系统还是大词表语音识别系统中都具有重要的理论意义和实用价值。
由于汉语具有发音短、混淆性高、方言多的特点,汉语数字语音识别
比英语数字语音识别难度更大,成为目前汉语语音识别领域的热点和
难点问题。
以隐马尔可夫模型为典型代表的统计方法,对动态时间序列有很
强的建模能力,在参数、结构和训练方法的选择上有很大的灵活性,
成为目前主流的语音识别方法。然而,由于隐马尔可夫模型是基于统
计的方法,模型的训练需要大量的样本,采集样本和训练模型的工作
量大,对样本数据的信息利用率不高;出现概率少的样本容易得不到
充分的训练而引起误识。
本文主要研究连续汉语数字音节的建模问题,提出一种新的人机
结合的数字音节特征提取方法,从连续数字语音中提取出建模和测试
用的数字音节样本集,把高维空间点覆盖理论应用于非特定人连续语
音识别,建立各数字音节的高维空间点覆盖神经网络模型,并使用测
试集进行建模正确性验证,验证结果正确率达到97%以上。该模型用
于一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识
别的新算法。
本文比较了在不同数量的建模样本下,HNI模型和高维空间点覆盖
神经网络模型对数字音节的建模能力,实验结果表明,样本数量较少
时,高维空间点覆盖神经网络模型的识别率明显高于HMM模型,高维
空间点覆盖神经网络模型能较合理地描述样本在特征空间的分布,对
样本的信息利用率高。
高维空间点覆盖神经网络通过对原构网样本和识别错误的样本的
重新学习,能明显提高识别率,表明高维空间点覆盖神经网络有较强
的学习能力;通过对识别错误的样本单独构建的高维空间点覆盖神经
网络,与原来的高维空间点覆盖神经网络之间进行有机结合,识别率
显著提高,证明高维空间点覆盖神经网络有较强的即时学习能力以适
应环境。这种不同模型之间易于集成的能力可以用在多语种多方言的
语音识别系统综合集成方面,为语音识别系统的广泛应用提供了光辉
的发展前景。
关键词连续语音识别单词音节隐马尔可夫模型高维空间几何高
维空间点覆盖神经网络
Ⅱ
THE ANDEXPERIMENTS
THEORY,ANALYSIS
THE
ABoUT
SPEECHRECoGNlTIoN
CoNTINoUS
ABSTRACT
mandarin
continuous recognition
Speaker-independent figurespeech
as
wide in fieldssuch
has speech
many telephone
system application
and
ofhome control
control appliances,industry
gateway,remote
and in
information hast
文档评论(0)