- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HMM_语音信号处理 5
5.1概述
5.2隐马尔科夫模型的引入
5.3隐马尔科夫模型的定义
5.4隐马尔科夫模型的基本算法
5.5隐马尔科夫模型的各种结构类型
5.6隐马尔科夫模型的一些实际问题;5.1 概述;5.2隐马尔科夫模型的引入;一个简单的三状态HMM的例子 ;物理过程分析:建立模型来描述这个序列的特征是非常重要的。
如果在分析的区间内,信号是非时变的或平稳的,那么使用众所周知的线性模型来描述该信号就可以了。例如,语音信号在短时间(约10~30ms)内认为是平稳的,所以,在一段短时间内,就可以用一个全零点模型或极零点模型来描述它,这就是线性预测(LPC)模型。
但整体来讲,语音信号是时变的,所以用模型表示时,其参数也是时变的。但是语音信号是慢时变信号,所以,简单的考虑方法是:在较短的时间内用线性模型参数来表示,然后,再将许多线性模型在时间上串接起来,这就是马尔可夫链(Markov链)。
Markov链虽然可以描述时变信号,但不是最佳的和最有效的。 ;HMM既解决了用短时模型描述平稳段的信号,又解决了每个短时平稳段是如何转变到下一个短时平稳段的。
HMM是由两个随机过程组成,一个随机过程描述状态和观察值之间的统计对应关系的,它解决了用短时模型描述平稳段的信号的问题;由于实际问题比Markov链模型所描述的更为复杂,观察到的事件并不是如Markov链模型中与状态一一对应,所以HMM 通过另一组概率分布相联系的状态的转移统计对应关系来描述每个短时平稳段是如何转变到下一个短时平稳段的。
语音识别的最大困难之一就是如何对语音的发音速率及声学变化建立模型。随着HMM被引入到语音识别领域中,这一棘手问题得到了较圆满地解决。HMM很好的描述了语音信号的整体非平稳性和局部平稳性,是一种较为理想的语音信号模型。 ;5.3隐马尔科夫模型的定义;特别地,当如下式成立时,则称其为1阶Markov过程,又叫单纯Markov过程。
系统在任一时刻所处的状态只与此时刻的前一时刻所处的状态有关。而且,为了处理问题方便,我们只考虑上式右边的概率与时间无关的情况,即:
同时满足:
这里 是当时刻t从状态i在时刻t+1到状态j的转移概率,当这个转移概率是与时间无关的常数时,又叫 是具有常数转移概率的Markov过程。
表示从状态i到状态j的转移是可能的。对于任意的i,j都有 则这个Markov过程是正则的。; 隐Markov模型
HMM是一个双内嵌式随机过程:由两个随机过程组成,一个是状态转移序列,它对应着一个单纯Markov过程。另一个是每次转移时输出的符号组成的符号序列。
在语音识别的HMM中,相邻符号之间是不相关的(这当然不符合语音信号的实际情况,这也是HMM的一个缺点,对此,已经有许多改进的HMM被提出)。这二个随机过程,其中一个随机过程是不可观测的,只能通过另一个随机过程的输出观察序列观测。设状态转移序列为 ,输出的符号序列为 ,则在单纯Markov过程和相邻符号之间是不相关的假设下(即 和 之间转移时的输出观察值 和其他转移之间无关),有下式成立:;
因为是隐Markov模型,把所有可能的状态转移序列都考虑进去,则有:
这就是上面我们计算输出符号序列aab的输出概率时所用的方法。; HMM的基本元素
根据以上的分析,对于语音识别用HMM可以用下面六个模型参数来定义,即:
:模型中状态的有限集合,即模型由几个状态组成。设有N 个状态, 。记t时刻模型所处状态为 ,显然 。在球与缸的实验中的缸就相当于状态。
:输出的观测值符号的集合,即每个状态对应的可能的观察值数目。记 个观察值为 ,记t时刻观察到的观察值为 ,其中 。在球与缸实验中所选彩球的颜色就是观察值。 ; :状态转移概率的集合。所有转移概率可以构成一个转移概率矩阵,即:
其中 是从状态 到状态 转移时的转移概率, 且有 , 。在球与缸实验中,它指描述每次在当前选取得缸的条件下选取下一个缸的概率。 ; :输出观测值概率的集合。 ,其中 是从状态 到状态 转移时观测值符号的输出概率。即缸中球的颜色 出现的概率。根据B可将HMM分为连续型和离散型HMM等。
:系统初始状态概率的集合, : 表示初始状态是 的概率,即,
在球与缸实验中,它指开始时选取某个缸的概率。
:系统终了状态的集合。
这里需要说明的是,严格地说Markov模型是没有终了状态的概念的,只是在语音识别里用的Marko
文档评论(0)