剖面隐含马尔可夫模型profileHMM实例分析.PDF

剖面隐含马尔可夫模型profileHMM实例分析.PDF

剖面隐含马尔可夫模型profileHMM实例分析

剖面隐含马尔可夫模型 (profileHMM)实例分析 引用包家立老师课件 模型结构 建立profileHMM 主要步骤: 1.确定匹配状态 (主状态) 2.计算匹配状态和插入状态符号的发出次数 3.计算各种状态的转移次数 4.将符号发出次数和状态转移次数分别转换为相应的概率 实例分析 X X 一 一 一 X 蝙蝠(bat) X A G 一 一 一 C X 大鼠(rat) X A — A G — C X 猫(cat) X A G — A A 一 X 蚊子(gna) X 一 一 A A A C X 山羊(goa) X A G 一 一 一 C X 0 1 2 3 4 “X” 其中 表示该列标记为匹配状态 (M) (I) (D) 剖面隐含马尔可夫模型包含匹配状态 ,插入状态 和缺失状态 三种状态的从左至右(left-right)的结构。 对剖面隐含马尔可夫模型,每个节点是匹配状态用矩形表示 ,插入( ) 状态用菱形表示 ,删除状态 用圆形表示 ,再引入开始( ) ( ) (start)状态和 结束(end)状态两个状态,这两个状态不发出任何符号。 匹配状态表示序列在该列有一个字符发出; 删除状态表示在该列没有字符发出; 插入状态允许在列与列之间发出附加字符; 因此,每条序列从开始到结束均通过这些状态穿越模型,每列都有残 基的分布和状态之间的转移。 剖面隐含马尔可夫模型 多序列联配状态转移概率和符号发出概率的计算方法 如下: (1) 首先计算匹配状态和插入状态符号的发出次数;(在 profile HMM 中,核酸序列比对的每一个匹配状态或插入状态或删除状态有 4 几个取值: 个) “A” 4 对于第一个匹配状态,发出符号 的次数是 ,发出其他符号的次 0 “G” 3 数均为 ;第二个匹配状态,发出符号 的次数是 ,发出其他符号 0 “C” 4 的次数均为 ;第三个匹配状态,发出符号 的次数是 ,发出其他 0 符号的次数均为 。 (2) 计算各种状态的转移次数; M0M1 4 M0I0 0 M0D1 1 , , ; I0M1 0 I0I0 0 I0D1 0 , , ; M1M2 3 M1I1 0 M1D2 1 , , ; I1M2 0 I1I1 0 I1D2 0 , , ; D1M2 0 D1I1 0 D1D2 1 , , ; M2M3 2 M2I2 1 M2D3 0 , ,

文档评论(0)

1亿VIP精品文档

相关文档