序列模式识别.ppt

序列模式识别

CpG Island: 预测结果 1. ATCGCA: 其中,CGC被预测为CpG Island ATCGCA 2. Viterbi算法:求出在当前结果最大的概率值,以及保存相应的路线 3. 递归算法:动态规划的算法 4. 该例中,我们假设状态转移概率矩阵已知 5. 如何推算状态的概率矩阵? 参数估计: Baum-Welch (EM) 算法 目的:给定观察值序列O,通过计算确定一个模型H, 使得P(O|H)最大 算法步骤: 1. 初始模型(待训练模型) H0, 2. 基于H0 以及观察值序列O,训练新模型 H; 3. 如果 log?P(O|H) - log(P(O|H0) Delta,说明训练结果已经收敛, 算法结束。 4. 否则,令H0 = H ,继续第2步工作 Baum-Welch算法: 操作流程 1. 以CpG Island为例 2. 需要估计的转移概率矩阵有四个值:Pii, Pig, Pgg, Pgi 3. 初始化转移概率矩阵H0,例如,都设为0.5 4. 用Viterbi算法算出所有给定数据的结果及路径 5. 根据所有的路径,可以得到Nii, Nig, Ngg, Ngi 6. 计算新的Pii, Pig, Pgg, Pgi 7. 如果结果收敛,停止;否则,重复4-6 CpG岛:HMM (2) 转移概率 发散概率 通过模型训练得到 马尔

文档评论(0)

1亿VIP精品文档

相关文档