隱马尔科夫链及其应用.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
隱马尔科夫链及其应用

隐马尔科夫链及其应用 学习概率的时候,大家一定都学过马尔科夫模型吧,当时就觉得很有意思,后来看了数学之美之隐马模型在自然语言处理中的应用后,看到隐马尔科夫模型竟然能有这么多的应用,并且取得了很好的成果,更觉的不可思议,特地深入学习了一下,这里总结出来。 马尔科夫过程 马尔科夫过程可以看做是一个自动机,以一定的概率在各个状态之间跳转。 考虑一个系统,在每个时刻都可能处于N个状态中的一个,N个状态集合是 {S1,S2,S3,...SN}。我们现在用q1,q2,q3,…qn来表示系统在t=1,2,3,…n时刻下的状态。在t=1时,系统所在的状态q取决于一个初始概率分布PI,PI(SN)表示t=1时系统状态为SN的概率。 马尔科夫模型有两个假设: 1.??????系统在时刻t的状态只与时刻t-1处的状态相关;(也称为无后效性) 2.??????状态转移概率与时间无关;(也称为齐次性或时齐性) 第一条具体可以用如下公式表示: P(qt=Sj|qt-1=Si,qt-2=Sk,…)= P(qt=Sj|qt-1=Si) 其中,t为大于1的任意数值,Sk为任意状态 第二个假设则可以用如下公式表示: P(qt=Sj|qt-1=Si)= P(qk=Sj|qk-1=Si) 其中,k为任意时刻。 下图是一个马尔科夫过程的样例图: 可以把状态转移概率用矩阵A表示,矩阵的行列长度均为状态数目,aij表示P(Si|Si-1)。 隐马尔科夫过程 与马尔科夫相比,隐马尔科夫模型则是双重随机过程,不仅状态转移之间是个随机事件,状态和输出之间也是一个随机过程,如下图所示: 此图是从别处找来的,可能符号与我之前描述马尔科夫时不同,相信大家也能理解。 该图分为上下两行,上面那行就是一个马尔科夫转移过程,下面这一行则是输出,即我们可以观察到的值,现在,我们将上面那行的马尔科夫转移过程中的状态称为隐藏状态,下面的观察到的值称为观察状态,观察状态的集合表示为 O={O1,O2,O3,…OM}。 相应的,隐马尔科夫也比马尔科夫多了一个假设,即输出仅与当前状态有关,可以用如下公式表示: P(O1,O2,…,Ot|S1,S2,…,St)=P(O1|S1)*P(O2|S2)*...*P(Ot|St) 其中,O1,O2,…,Ot为从时刻1到时刻t的观测状态序列,S1,S2,…,St则为隐藏状态序列。 另外,该假设又称为输出独立性假设。 举个例子 举个常见的例子来引出下文,同时方便大家理解!比如我在不同天气状态下去做一些事情的概率不同,天气状态集合为{下雨,阴天,晴天},事情集合为{宅着,自习,游玩}。假如我们已经有了转移概率和输出概率,即P(天气A|天气B)和P(事情a|天气A)的概率都已知道,那么则有几个问题要问(注意,假设一天我那几件事情中的一件), 1.?????????????假如一周内的天气变化是 下雨-晴天-阴天-下雨-阴天-晴天-阴天,那么我这一周 自习-宅着-游玩-自习-游玩-宅着-自习的概率是多大? 2.?????????????假如我这一周做事序列是 自习-宅着-游玩-自习-游玩-宅着-自习, 不知道天气状态的情况下这个做事序列的概率是多大? 3.?????????????假如一周内的天气变化是 下雨-晴天-阴天-下雨-阴天-晴天-阴天,那我们这一周最有可能的做事序列是什么? 4.?????????????假如我这一周做事序列是 自习-宅着-游玩-自习-游玩-宅着-自习,那么这一周的天气变化序列最有可能是什么? 对于第一个问题,我想大家应该都能很快知道怎么算。(啥?不知道,答案在本文最后) 隐马模型基本要素及基本三问题 综上所述,我们可以得到隐马尔科夫的基本要素,即一个五元组{S,N,A,B,PI}; S:隐藏状态集合; N:观察状态集合; A:隐藏状态间的转移概率矩阵; B:输出矩阵(即隐藏状态到输出状态的概率); PI:初始概率分布(隐藏状态的初始概率分布); 其中,A,B,PI称为隐马尔科夫的参数,用X表示。 由上述问题可以引出隐马尔科夫的三个基本问题的其中两个,下文中为了简便,将隐马尔科夫模型简称为HMM(Hiden Markov Model)。 HMM的三个基本问题是: 1.??????给定模型(五元组),求某个观察序列O的概率(样例问题2) 2.??????给定模型和观察序列O,求可能性最大的隐藏状态序列(样例问题4)。 3.??????对于给定的观察序列O,调整HMM的参数,使观察序列出现的概率最大。 前向算法 对于第一个基本问题,计算公式为: 即对于观察序列O,我们需要找出所有可能的隐藏状态序列S,计算出在给定模型下S输出为O的概率(就是样例问题一啊),然后计算概率之和。 直观上看,假如序列O的长度为T,模型的隐藏状态集合大小为N,那么一

文档评论(0)

sd47f8cI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档