HMM模型在语音识别研究中应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HMM模型在语音识别研究中应用

HMM模型在语音识别研究中应用   摘要:语音识别是人工智能最基础性课题,该课题研究者通过对隐马尔可夫模型这一数学模型的扩领域应用,解决了声学、语言学、句法等统计知识相关性问题。文章系统阐述了隐马尔可夫模型原理以及在语音识别中的应用过程,从而为更多研究者了解和认识。   关键词:隐马尔可夫模型(HMM);数学模型;语音识别   中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)34-1966-03   The Application of HMM in Speech Recognition   WANG Kun-qing   (Dongying Municipal Bureau of Finance, Dongying 257061, China)   Abstract: Speech recognition is one of the basic tasks in the research of artificial intelligence. Researchers apply such mathematic model as Hidden Markov Model to this field and solve acoustic, linguistics, syntax, such as statistical knowledge of the relevant issues. This article systemaficly expounds the principle of the mathematic mode-HMM and process of its application in the speech recognition in the aspects of speech recognition,so more researchers will have a better understanding about HMM.   Key words: hidden markov model; mathematical model speech; recognition      1 引言   语音识别是自然语言理解的基础性课题,旨在使计算机能够在一定程度上识别理解人类的语音。从20世纪50年代初,一些学者试图设计了第一个自动语音识别系统及孤立词的数字识别系统研究开始,到60年代中期才逐步取得实质性的进展,Reddy利用音素的动态跟踪技术在连续语音识别中的初步研究,到70年代日本学者提出的动态时间弯折算法DTW(Dynamic Time Warping)对小词表的研究获得了成功;以及在语音编码中使用的线性预测编码(LPC)技术成功的应用到语音识别系统中,再到了80年代从基于模板匹配的方法到统计模型的方法的转换,尤其是隐马尔可夫模型HMM(Hidden Markov Model)技术被应用到语音识别中,由于该模型具有把从声学―语言学到句法等统计知识全部集成在一个统一框架中的优点,因此它被广泛地应用到语音识别研究中,到目前为止,HMM技术仍然是语音识别研究中的主流技术。   2 隐马尔可夫模型   HMM模型是一个双重的随机过程,即一个隐藏的(不可观察的)具有有限状态的马尔可夫链和一个与马尔可夫链状态相关联的随机函数集(可观察的)。这样,语音等时变信号的功率谱可以唯一地由模型对应的状态的随机函数决定,而信号频谱时间的变化则由隐藏的马尔可夫链的转移概率规律决定,因此非常适合建立语音信号的统计模型。   2.1 马尔可夫链   对于某一个随机试验,设Ω是由所有样本点{w}构成的样本空间,ξ是Ω上随机事件构成的事件集合,称为σ―代数,P是定义在ξ上的概率。则称定义在概率空间(Ω,ξ,P)上的随机变量族X={x,(w),t∈T}为随机过程。其中,T为一参数集。可将随机过程看为二个变量的函数xt(w)=x(w,t),其中,t∈T;w∈Ω。对于固定的w,xt(w)是个随机变量,记为xt。若将参数t看作时间,那么xt就表示随机系统在时刻t所处的状态。若T是一个含有可列元素的无限集,则称该随机过程为离散随机过程或随机序列。一个随机过程所有可能取值的集合称为该过程的状态空间,记为S。 若S是可列集或有限集,则称此过程为链。   设随机过程X={xn,n=0,1…}是定义在(Ω, ξ, P)上的离散随机过程,其状态空间S为有限集或可列集。并且X具有无后效性即马尔可夫性:   对任意非负整数n,及任意状态i0 ,i1, …in+1∈S;   只要P(x0= i0,x1= i1,…,xn= in)0   总有P(xn+1= in+1|x0= i0,…,xn= in)=P(x

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档