HMM_语信号处理第5章.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5.1概述 5.2隐马尔科夫模型的引入 5.3隐马尔科夫模型的定义 5.4隐马尔科夫模型的基本算法 5.5隐马尔科夫模型的各种结构类型 5.6隐马尔科夫模型的一些实际问题 5.1 概述 隐马尔可夫模型(HMM),作为语音信号的一种统计模型,今天正在语音处理各个领域中获得广泛的应用。由于Bell实验室Rabiner等人在80年代中期对HMM的深入浅出的介绍,使HMM为世界各国从事语音信号处理的研究人员所了解和熟悉,进而成为公认的一个研究热点。近几十年来,隐马尔可夫模型技术无论在理论上或是在实践上都有了许多进展。其基本理论和各种实用算法是现代语音识别等的重要基础之一。 5.2隐马尔科夫模型的引入 HMM是一个输出符号序列的统计模型,具有N个状态 ,它按一定的周期从一个状态转移到另一个状态,每次转移时,输出一个符号。转移到哪一个状态,转移时输出什么符号,分别由状态转移概率和转移时的输出概率来决定。因为只能观测到输出符号序列,而不能观测到状态转移序列(即模型输出符号序列时,是通过了哪些状态路径,不能知道),所以称为隐藏的马尔可夫模型。 一个简单的三状态HMM的例子 物理过程分析:建立模型来描述这个序列的特征是非常重要的。 如果在分析的区间内,信号是非时变的或平稳的,那么使用众所周知的线性模型来描述该信号就可以了。例如,语音信号在短时间(约10~30ms)内认为是平稳的,所以,在一段短时间内,就可以用一个全零点模型或极零点模型来描述它,这就是线性预测(LPC)模型。 但整体来讲,语音信号是时变的,所以用模型表示时,其参数也是时变的。但是语音信号是慢时变信号,所以,简单的考虑方法是:在较短的时间内用线性模型参数来表示,然后,再将许多线性模型在时间上串接起来,这就是马尔可夫链(Markov链)。 Markov链虽然可以描述时变信号,但不是最佳的和最有效的。 HMM既解决了用短时模型描述平稳段的信号,又解决了每个短时平稳段是如何转变到下一个短时平稳段的。 HMM是由两个随机过程组成,一个随机过程描述状态和观察值之间的统计对应关系的,它解决了用短时模型描述平稳段的信号的问题;由于实际问题比Markov链模型所描述的更为复杂,观察到的事件并不是如Markov链模型中与状态一一对应,所以HMM 通过另一组概率分布相联系的状态的转移统计对应关系来描述每个短时平稳段是如何转变到下一个短时平稳段的。 语音识别的最大困难之一就是如何对语音的发音速率及声学变化建立模型。随着HMM被引入到语音识别领域中,这一棘手问题得到了较圆满地解决。HMM很好的描述了语音信号的整体非平稳性和局部平稳性,是一种较为理想的语音信号模型。 5.3隐马尔科夫模型的定义 离散Markov过程 Markov链是Markov 随机过程的特殊情况,即Markov链是状态和时间参数都离散的Markov过程。 设在时刻t的随机变量用 、其观察值用 表示,则如果当 的前提下, 的概率是如下式所示,则称其为n阶Markov过程 特别地,当如下式成立时,则称其为1阶Markov过程,又叫单纯Markov过程。 系统在任一时刻所处的状态只与此时刻的前一时刻所处的状态有关。而且,为了处理问题方便,我们只考虑上式右边的概率与时间无关的情况,即: 同时满足: 这里 是当时刻t从状态i在时刻t+1到状态j的转移概率,当这个转移概率是与时间无关的常数时,又叫 是具有常数转移概率的Markov过程。 表示从状态i到状态j的转移是可能的。对于任意的i,j都有 则这个Markov过程是正则的。 隐Markov模型 HMM是一个双内嵌式随机过程:由两个随机过程组成,一个是状态转移序列,它对应着一个单纯Markov过程。另一个是每次转移时输出的符号组成的符号序列。 在语音识别的HMM中,相邻符号之间是不相关的(这当然不符合语音信号的实际情况,这也是HMM的一个缺点,对此,已经有许多改进的HMM被提出)。这二个随机过程,其中一个随机过程是不可观测的,只能通过另一个随机过程的输出观察序列观测。设状态转移序列为 ,输出的符号序列为 ,则在单纯Markov过程和相邻符号之间是不相关的假设下(即 和 之间转移时的输出观察值 和其他转移之间无关),有下式成立: 因为是隐Markov模型,把所有可能的状态转移序列都考虑进去,则有: 这就是上面我们计算输出符号序列aab的输出概率时所用的方法。 HMM的基本元素 根据以上的分析,对于语音识别用HMM可以用下面六个模型参数来定义,即: :模型中状态的有

文档评论(0)

sd44055 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档