网站大量收购独家精品文档,联系QQ:2885784924

生物序列的HMM方法.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物序列的HMM方法

* 第五章 生物序列的 HMM方法 (Part 2) Introduction to Computational Biology §5.3 生物序列的隐Markov模型 Introduction to Computational Biology 构造模型,刻划较长DNA序列中的结构(CpG岛+非CpG岛区) 例子:人类基因组中与启动子相关的CpG岛信号 (1)给定一段DNA序列片段,判别它是否CpG岛? 对应于Markov过程问题 (2)给定一段长DNA序列,识别其中的CpG岛? 对应于隐Markov模型问题 将描述CpG岛的“Model +”和描述非CpG岛的“Model -”结合在一条序列中的Markov过程 增加CpG岛与非CpG岛交界的状态转移 Introduction to Computational Biology A+ C+ G+ T+ A– C– G– T– 刻划含CpG岛结构的DNA序列的HMM模型 (注意:除图中所示的状态转移外, “Model +”和 “Model -” 内的状态转移的定义仍然保留,但图中未标示) Model + (CpG岛) Model - (非CpG岛) G– G+ G Hidden Observed Introduction to Computational Biology 5.3.1 HMM的定义 C– G– G+ C+ G+ A+ T– A– C G G C G A T A 观察序列x 状态序列? xi-1 xi Observed Hidden 区分:观察序列x和状态序列?,都用Markov过程来描述。 状态序列?也称为路径(path) ? i-1 ? i 定义状态转移概率(Transition probability)akl: 人为添加状态序列的起始和结束状态: Introduction to Computational Biology 定义输出概率ek(b) (emission probability)为: 表示在状态? i取k时,该状态导致产生符号b(可以是单个符号,也可以是字符串)的概率。 附:CpG岛模型 注意:状态转移概率akl和输出概率ek(b)的定义都是一种条件概率。 Introduction to Computational Biology 例1:GpC岛的HMM模型参数 状态:{A+, C+, G+, T+, A?, C?, G?, T?} 输出符号:{A, C, G, T} 状态转移概率: Introduction to Computational Biology 例2:赌场骰子的HMM模型参数 0.95 Fair Loaded point 1: 1/6 point 2: 1/6 point 3: 1/6 point 4: 1/6 point 5: 1/6 point 6: 1/6 point 1: 1/10 point 2: 1/10 point 3: 1/10 point 4: 1/10 point 5: 1/10 point 6: 1/2 0.9 0.05 0.1 状态:{F, L} 输出符号:{1, 2, 3, 4, 5, 6} Introduction to Computational Biology F F F F F L L L 4 4 5 4 3 6 3 6 观察序列x 状态序列? xi-1 xi Hidden ? i-1 ? i ?1 a0, ?1 e?1(b) x1 ?2 a?1, ?2 e?2(b) x2 ?3 a?2, ?3 e?3(b) x3 ?4 a?3, ?4 e?4(b) x4 HMM产生观察符号序列的机制: Observed Introduction to Computational Biology 对于观察序列x和状态路径?,可以计算它们的联合概率: C+ G– C– G+ C G C G 观察序列x 状态序列? Introduction to Computational Biology 5.3.2 Viterbi算法——最大可能路径 C– G– G+ C+ G+ A+ T– A– C G G C G A T A xi-1 xi ? i-1 ? i 观察序列 Observation sequences 隐状态序列 Underlying states 译码问题 Decoding ? Introduction to Computational Biology 预测隐状态序列的准则 选择最大可能状态路径(Most prob

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档