剖面隐含马尔可夫模型profileHMM实例分析
剖面隐含马尔可夫模型 (profileHMM)实例分析
引用包家立老师课件
模型结构
建立profileHMM 主要步骤:
1.确定匹配状态 (主状态)
2.计算匹配状态和插入状态符号的发出次数
3.计算各种状态的转移次数
4.将符号发出次数和状态转移次数分别转换为相应的概率
实例分析
X X 一 一 一 X
蝙蝠(bat) X A G 一 一 一 C X
大鼠(rat) X A — A G — C X
猫(cat) X A G — A A 一 X
蚊子(gna) X 一 一 A A A C X
山羊(goa) X A G 一 一 一 C X
0 1 2 3 4
“X”
其中 表示该列标记为匹配状态
(M) (I) (D)
剖面隐含马尔可夫模型包含匹配状态 ,插入状态 和缺失状态
三种状态的从左至右(left-right)的结构。
对剖面隐含马尔可夫模型,每个节点是匹配状态用矩形表示 ,插入( )
状态用菱形表示 ,删除状态 用圆形表示 ,再引入开始( ) ( ) (start)状态和
结束(end)状态两个状态,这两个状态不发出任何符号。
匹配状态表示序列在该列有一个字符发出;
删除状态表示在该列没有字符发出;
插入状态允许在列与列之间发出附加字符;
因此,每条序列从开始到结束均通过这些状态穿越模型,每列都有残
基的分布和状态之间的转移。
剖面隐含马尔可夫模型
多序列联配状态转移概率和符号发出概率的计算方法
如下:
(1) 首先计算匹配状态和插入状态符号的发出次数;(在 profile
HMM 中,核酸序列比对的每一个匹配状态或插入状态或删除状态有
4
几个取值: 个)
“A” 4
对于第一个匹配状态,发出符号 的次数是 ,发出其他符号的次
0 “G” 3
数均为 ;第二个匹配状态,发出符号 的次数是 ,发出其他符号
0 “C” 4
的次数均为 ;第三个匹配状态,发出符号 的次数是 ,发出其他
0
符号的次数均为 。
(2) 计算各种状态的转移次数;
M0M1 4 M0I0 0 M0D1 1
, , ;
I0M1 0 I0I0 0 I0D1 0
, , ;
M1M2 3 M1I1 0 M1D2 1
, , ;
I1M2 0 I1I1 0 I1D2 0
, , ;
D1M2 0 D1I1 0 D1D2 1
, , ;
M2M3 2 M2I2 1 M2D3 0
, ,
您可能关注的文档
最近下载
- 档案整理及数字化投标方案(517页).doc VIP
- 第六章+第三节++黄土高原课件-2023-2024学年商务星球版地理八年级下册.pptx VIP
- 高一上期末数学试卷(含答案).doc VIP
- 2024年11月全国事业单位联考综合应用能力(A类)试题及参考答案.pdf VIP
- 《地理信息系统原理与应用》课程标准.doc VIP
- 商务星球版初中地理八年级下册第六章第三节黄土高原.pptx VIP
- 病句的修改大全修改病句大全及答案.docx VIP
- 1.《地理信息系统技术应用》课程标准.docx VIP
- 最优控制-西安交通大学课件lecture07.ppt VIP
- 最优控制-西安交通大学课件lecture5.ppt VIP
原创力文档

文档评论(0)