- 33
- 0
- 约小于1千字
- 约 8页
- 2016-09-16 发布于湖北
- 举报
如何应用HMM模型识别CPG岛.ppt
如何应用HMM模型识别CpG岛 张宏志 CpG岛的定义 一类长度在几百bp的特殊DNA序列,其中CG核苷酸出现的频率非常高,即为CpG岛。例如:ACGCGCGTACGCGAAT 隐马尔库夫模型 一个HMM模型是一个三元组M=(A,S, ⊙) A:字母表 S: 有限状态集合,每个状态可以释放字母 表中的字符 ⊙:为概率集合,包括两个部分 状态转换概率fk,l k,l∈S,表示从状态k转 换到l的概率; 字符释放概率ek(b) k∈s,b∈A,表示在状态k下释放 出字符b的概率 隐马尔库夫模型 令路径∏=(∏1,∏2,…,∏L)是一个相继状态序列 X=(x1,x2,…,xL)是一个字符序列 对于给定的路径∏,可以按下面的公式计算出产生序列X的概率 这里令∏0 为起始状态,∏L+1为终止状态。 应用HMM模型识别CpG岛 ㈠模型的建立 八个状态:A﹢ C﹢ G﹢ T﹢ A﹣ C﹣ G﹣ T﹣ “ + ”表示在CpG 岛内,“﹣ ”表示在CpG岛外 此模型将所有释放概率都设为1,(释放字符为AGCTAGCT)所以只考虑其转移概率 A无法确定其为A﹢还是A﹣,故此次模型是HMM模型,其观察的序列不是状态本身 A的下一状态可能
原创力文档

文档评论(0)