- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语连续语音识别中的动态特性建模方法研究¨2’摘
汉语连续语音识别中的动态特性建模方法研究¨2’
摘 要
语音识别的目的是让计算机听懂并最终理解人类的语音,从而提 供一种最自然的人机交互手段。经过近50年的研究,语音识别技术 仍然存在很多难题和挑战。现代语音识别技术中最主要的研究方向是 大词汇量连续语音识别。
《对语音识别而言,最困难的是对语音的多样性建模。而语音是一 个时间相关性明显的非平稳随机过程,采用平稳过程的HMM来描述 语音,必然存在不合理性。虽然通过区别性训练、增加语法模型等手 段可以提高HMM的识别性能,但是并不能从根本上解决语音的非平 稳性和模型的平稳性之间的矛盾。近年来,出现了不少动态语音模型, 通过调整HMM的参数,使其具备可变特性以提高语音识别的性能。07’。
为了更好地描述语音的动态特性,本文提出了一种动态HMM结 构,在静止状态和观察之间增加了动态状态层。每一帧观察都对应于 个独立的动态状态,而动态状态由动态特性和静止状态决定。采用 贝叶斯网络对动态HMM的结构进行分析可以得到动态HMM的训l练
和识别算法。
\在动态HMM中所使用的动态特性必须具备连续性、一致性等要 求。本文选用了音韵学特征如共振峰、基音频率作为动态特性。由于
1)卜海市科委重点基金项目资助(01JCl4033)
2)毗尔实验室f:海分部资助
pla上殉交通』、学博J学位论文这些特征在清音部分不存在,因此,需要采用扩展算法进行扩展。实
pla上殉交通』、学博J学位论文
这些特征在清音部分不存在,因此,需要采用扩展算法进行扩展。实 验结果表明采用扩展的基音频率曲线作为动态特性可以有效提高语 音识别的性能。而采用共振峰作为动态特性的动态HMM则由于共振 峰的先验概率分布而导致动态HMM识别性能下降。通过在动态 HMM中引入动态特性的先验概率分布或者采用均值抵消的方法,以 前三个共振峰作为动态特性的动态HMM取得了较好的识别性能。动 态HMM对带调语音识别和不带调语音识别都有很好的识别性能。
由于动态特性的提取和扩展算法在训练和识别过程中不能完全一 致,会直接导致动态HMM性能的下降,甚至完全不可适用。通过对 动态特性后验概率分布的研究,选择采用动态特性在给定静止状态下 的均值作为对动态特性的估计用于识别,从而解决了由于动态特性未 知或者提取算法存在误差造成的影响。实验结果表明,采用动态特性 自动提取算法可以达到甚至超过使用已经提取的动态特性的识别性 能。
当动态特性的提取在训练和识别过程中都无法得到时,就无法采 用动态HMM。为了达到对于隐含动态特性建模的目的,引入预测的 动态特性和估计的动态特性的概念。预测的动态特性描述了动态特性 的时序关系,而估计的动态特性则描述了当前的观察和状态对动态特 性的影响。把这两个动态特性线性组合,就得到了隐含的动态特性。 在隐含动态特性的基础上,本文提出了隐含动态HMM。
隐含动态HMM的训练算法是~个同时得到最优动态特性和最优 模型参数的过程。可以通过扩展的EM算法,分5个步骤实现隐含动
态HMM的训练过程。
态HMM的训练过程。 这一过程需要对动态关联矩阵进行合理的初始化。对动态特性、
动态HMM、隐含动态HMM的等价性和相似性研究表明,采用主成 分分析作为动态特性关联矩阵初始化的隐含动态HMM最为合理。
对于隐含动态HMM的实验结果表明,采用主成分分析作为初始 化的隐含动态HMM可以取得很好的识别性能。对不同情况下的模型 实验也表明,隐含动态HMM对小词汇量、大词汇量上下文无关、大 词汇量上下文关联的语音识别都有较好的识别性能。
而隐含动态HMM对模型性能的改善随着模型数的增加而降低, 分析认为主要是模型数的增加造成了训练语料的减少,从而导致隐含 动态HMM的训练不足。同时实验结果还表明,随着隐含动态特性维 数的增加,模型性能的提高幅度也开始减缓。
对于语音动态特性的研究表明,在语音模型中增加对动态特性的 描述可以有效提高语音识别性能。动态HMM、隐含动态HMM提供 了描述语音动态特性的一种有力手段,具有很强的通用性,适用于不 同情况下语音的动态特性建模。. ,
关键词:语音识别,大词汇量连续语音识别,隐马尔可夫模型,动态
一HMM,F,婴HMM,垫坌断
n
——
—— 生!i!塑銮望!:堂堡!堂些!!苎——
STUDY oN DYNAMlC PROPERTY MODELLING FOR MANDARIN CONTINUOUS SPEECH RECOGNITIONl’2’
ABSTRACT
The goal of research in speech recognition is to make the speech of human beings being underst
您可能关注的文档
- 国外现代地域主义建筑研究-建筑历史与理论专业论文.docx
- 海洋环境下FRP筋混凝土梁的时变可靠度研究-建筑与土木工程专业论文.docx
- 国内c2c电子商务信用管理研究-企业管理专业论文.docx
- 国内c2c电子商务信用管理分析-企业管理专业论文.docx
- 故障转子系统非线性动力学若干问题的数值分析及其特征研究-机械设计及理论专业论文.docx
- 国产行业电影研究-传播学专业论文.docx
- 滚动轴承故障诊断技术及其工业应用-工程硕士专业论文.docx
- 冠状动脉粥样硬化相关因子血浆水平变化及奥扎格雷钠对其干预作用-内科学(心血管)专业论文.docx
- 海面溢油风化与鉴定研究-环境科学专业论文.docx
- 硅基集成纳机电探针技术的研究-微电子与固体电子学专业论文.docx
原创力文档


文档评论(0)