genscan算法介绍-生物信息课题组.pptVIP

  • 34
  • 0
  • 约1.56千字
  • 约 17页
  • 2018-08-06 发布于天津
  • 举报
genscan算法介绍-生物信息课题组

Genscan 介绍 刘 玮 2001.11.1 Genscan的用途 基因的识别 外显子 内含子 基因间区域 转录信号 翻译信号 剪接信号 等等…… 基因结构 基因识别的方法 利用同源比对.(blast) 基于基因中编码序列和非编码序列区域碱基的统计差异性. 根据真核基因的生物结构,建立整体的基因预测模型.(Genscan) Genscan Genscan程序是通过设计基因序列模型来得到真核生物的基因.其编码区使用五阶的马可夫模型,而不使用来自同源信息的模型,使得Genscan的结果不依靠于目前的蛋白库中的相似基因,从而提供了于同源基因识别不一样的方法. 基因序列结构模型 该模型本质是不完全的马可夫模型(semi Markov),Genscan中使用state duration HMM 来说明. 模型可以看成序列φ: 顺序的状态集 q={q1,q2,......,qn} 状态相对应的长度集(持续时间) d={d1,d2,......,dn}, 对每一个状态, 使用分别概率模型P 形成长度为L=∑di (I=1...n)的DNA序列 模型通过以下步骤形成的长度为L的序列: 1.由初始状态集π得到初始状态q1 2.状态q1相对应的长度d1是由长度分配集?Q给出 3.在

文档评论(0)

1亿VIP精品文档

相关文档