隐马尔可夫模型.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2021/10/101

思考题:对给定的一定长度的DNA序列,识别其上CpG岛大致位的方法。2021/10/102

两个问题:(1)给定一段DNA序列片段,判断它是否是CpG岛?对应于Markov模型问题(2)给定一段DNA序列,识别其中的CpG岛?对应于隐Markov模型问题2021/10/103

主要内容隐马尔可夫模型的基本概念隐马尔可夫模型中的三个基本问题隐马尔可夫模型的生物信息学应用—CpG岛识别2021/10/104

一、隐马尔可夫模型的基本概念2021/10/105

(1)HMM的基本概念马尔可夫模型主要是把一个总随机过程看成一系列状态的不断转移,其特性主要使用“转移概率”来表示。HMM则认为模型的状态是不可观测的(这是“隐”的由来)。能观测到的只是它表现出的一些观测值(observations)2021/10/106

123a12a21a22a11a23a32a13a31a33例:隐马尔可夫链—观测三个硬币状态2021/10/107

每个硬币代表一个状态;每个状态有两个观测值:正面H和反面T;每个状态产生H的概率:P(H);每个状态产生T的概率为:1-P(H)2021/10/108

对比两个模型可见:马尔可夫模型的观测序列本身就是状态序列;隐马尔可夫模型的观测序列不是状态序列;2021/10/109

设有N个篮子,每个都装了许多彩色小球,小球颜色有M种.现在按下列步骤产生出一个输出符号(颜色)序列:按某个初始概率分布,随机的选定一个篮子,从中随机地取出一个球,记录球的颜色作为第一个输出符号,并把球放回原来的篮子.然后按照某个转移概率分布(与当前篮子相联系)选择一个新的篮子(也可能仍停留在当前篮子),并从中随机取出一个球,记下颜色作为第二个输出符号.引例22021/10/1010

如此重复地做下去,这样便得到一个输出序列.我们能够观测到的是这个输出序列—颜色符号序列,而状态(篮子)之间的转移(状态序列)被隐藏起来了.每个状态(篮子)输出什么符号(颜色)是由它的输出概率分布(篮子中彩球数目分布)来随机决定的.选择哪个篮子(状态)输出颜色由状态转移矩阵来决定.2021/10/1011

隐马尔可夫模型的示例—赌场欺诈问题:(本例来自戴培山等生物信息专题课件)某赌场在投骰子,根据点数决定胜负。在多次投掷骰子的时候采取了如下手段进行作弊:准备了两个骰子A和B,其中A为正常骰子,B为灌铅骰子,由于怕被发现,所有连续投掷的时候偶尔使用一下B,A和B之间转换的概率如下:2021/10/1012

2021/10/1013

2021/10/1014

2021/10/1015

2021/10/1016

2021/10/1017

2021/10/1018

(2)隐马尔可夫模型的参数①状态总数N;②每个状态对应的观测事件数M;③状态转移矩阵:④每个状态下取所有观测事件的概率分布:⑤起始状态:2021/10/1019

2021/10/1020

我们将图对应到赌场作弊问题,以便深入理解隐马尔可夫模型:2021/10/1021

赌场作弊隐马尔可夫模型中,状态空间—观测空间示意图:2021/10/1022

注:隐马尔可夫模型中,是马尔可夫链,是隐蔽层,是不可观测的,也称为状态链。是观测到的序列,是一个随机序列,也称为观测链。因此,隐马尔可夫模型是有两个随机过程组成:即由状态链(马尔可夫链)和观测链组成2021/10/1023

二、隐马尔可夫模型中的三个基本问题(1)评估问题(evaluation):从骰子的数列中推断是否使用了作弊骰子,如果知道使用了作弊骰子,那么在投掷骰子的过程中出现这个序列的概率有多大。(2)解码问题(decoding):如果确实使用了作弊骰子,这些序列中哪些点是由B投掷出来的。(3)学习问题(Learning):也称为参数训练问题,即仅仅给出大量的数据点,如何从中推断出细节问题(如骰子B投出各个点的概率?赌场是何时偷换的骰子的)。2021/10/1024

问题一:给定模型参数和观测序列,如何快速求出在该模型下,观测事件序列发生的概率?问题二:给定模型参数和观测序列,如何找出一个最佳状态序列?问题三:如何得到模型中的五个参数?2021/10/1025

问题一:前向和后向算法(估计问题)问题二:Viterbi算法(解码问题)问题三:

文档评论(0)

HappyPanda + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档