生物序列的同源性搜索_-blast简介及其应用选读.ppt

生物序列的同源性搜索_-blast简介及其应用选读.ppt

* 2. 在同一条对角线中临近的增强点成为一个增强段。每一个增强点都赋予一个正的分值,一个增强段中相邻的两个增强点之间的不匹配区域赋予一定的负值。一个增强段对应于一段相匹配的子序列,分值最高的段被标记为init1。 FASTA算法(二) * 引入indel。把那些没有重叠(non-overlap)的增强段拼接起来(增强段的分值之和减去空位处罚)。分值最高的区域记为initn。 FASTA算法(三) * 4. 对最有可能的匹配序列进一步评分:以增强段init1所在的对角线为中心,划分出一个较狭窄的对角线带,利用S-W算法,来获得分值最高的局部比对,记作opt。 FASTA算法(四) * 决定采用initn或opt的分值,前者敏感度低但速度快。FASTA对每一个检索到的比对都提供一个统计学显著性的评估,以判断该比对的意义。 FASTA算法(五) * * 注意… FASTA对DNA序列搜索的结果要比对蛋白质序列搜索的结果更敏感。它对数据库的每一次搜索都只有一个最佳的比对,一些有意义的比对可能被错过。 * 两个保守区域的信息 返回 * Dot matrix 分析 * 用Dot matrix分析基因中的重复序列 * 使用Dotter在斑马鱼序列的contig中定位ddah基因的位置 * A dot-matrix program with dynamic threshold contr

文档评论(0)

1亿VIP精品文档

相关文档