* * * * CUCCCUCCGUCCCACAAUAUAAGGGAUUUUGAGUUUUCGAUUGCAGUGUUUGACCACUCGUCUUAUUCAAAUUUUUUUUGUAAAUAUAAAAAAUGAAAAGUUGUGCUUAAAGUACUGUAUAUAAUAAAGUAAGUCACAAAUAAAAUAAAUAAUAAUUUCAAAAAAAAAAUGAAUAAAACGAGUGGUCAAACGUUGCAAACAAAAACUCAAAAUCCCUUAUAUUAUGGGAUGGAGGGAG * /content/31/13/3537.full Figure 1.?Multiple alignment of coding DNA. (A) How?alignment at the DNA level may lead to incorrectly aligned codon–codon boundaries. (B) How alignment of coding DNA at the amino acid level yields an alignment where analogous codon positions are properly lined up. The encoded amino acids are indicated at the bottom of (B) * /etblast3/ * * * * * * * * 事实上,积分体系的内在原理是概率论,分值是与偶然排列相比的概率比值的对数形式(所以可以相加log(P1*P2*P3)=log(P1)+log(P2)+log(P3)=4+1+(-3)=2)。可以这么认为:18分表示2^(18/2)=512倍于偶然的期望值. 公式为2^(Score/2)。 * PAM:Point/percent accepted mutation, by Dayhoff 被进化所接受的点突变BLOSUM: Blocks substitution matrix (PNAS, 1992) 基于较易比对的近缘物种的蛋白构建。BLOSUM更新,使用的数据量更大些,优先考虑。 BLOSUM是根据比对的保守区块中aa的变化构建的(局部比对),所以更适合发现蛋白质的保守区块。BLOSUM所有数据均来源于直接实验观察的结果,比如BLOSUM62源于60%左右同一性的基因家族成员之间的比对。BLOSUM80就是80%同一性。 PAM比对的所有aa都用上了(相似度85%序列的全局比对,共获得1572个变异)。PAM1数据来源于实验,而PAM250则是PAM1自乘250次得到,用于表征远缘序列。 这些矩阵都是对称的,因为无法确认是A-B还是B-A,所以认为概率上一样。 有意思的是,有研究表明BLOSUM62作者存在计算错误,但是确实很好用:Mark P Styczynski; Kyle L Jensen, Isidore Rigoutsos, Gregory Stephanopoulos (2008). BLOSUM62 miscalculations improve search performance. Nat. Biotech. 26 (3): 274–275. doi:10.1038/nbt0308-274. PMID * 基于相似性记分,可以提供两条序列相似性的评价 换个角度,还可以有距离记分,强调一条序列需要变化多少次才能变成另一条。这种记分可以用于进化分析,下节课讲。 * /wiki/Sequence_alignment 两条序列间可能的对位排列方式为(2^(2N))/sqrt(pi*N),其中N为较长的序列的长度。N=250时有10^149种,远远大于宇宙内所有原子的总数。 Needleman-Wunsch Algorithm: global alignment Smith-Waterman Algorithm: local alignment /wiki/File:Zinc-finger-dot-plot.png using the publicly available?DNAdot?tool 点阵分析还通常用于RNA二级结构分析,易于鉴别发卡结构 动态规划:/users/CH391L/Handouts/Lecture5-NBT-primer-dynamicprogramming.pdf 测试: CGGATCAT CTCAACT Sequence A: CAATTGA Sequence B: GAATCTGC * /wiki/BLAST high-scoring segment pair, HSP * * * * * * * 先计算出与每条
您可能关注的文档
- 广东省中山市2016中考化学第十四章化学反应基本类型复习课件新人教版摘要.ppt
- 核磁共振图谱解析培训手册摘要.doc
- 广东省中医院公开102种靓汤配方摘要.doc
- 核磁共振一维、二维谱图11摘要.ppt
- 广东省珠海市2014-2015学年高一上学期期末考试地理试题摘要.doc
- 广东省珠海市2015-2016学年高二下学期期末学生学业质量监测生物试题Word版含答案摘要.doc
- 广东省珠海市2015-2016学年高一下学期期末学生学业质量监测生物试题Word版含答案摘要.doc
- 广东省珠海市2016届高三9月摸底考试生物试卷摘要.doc
- 核磁共振原理摘要.doc
- 广东学习网继续教育网络考试+参考答案:海洋工程——海洋生态学摘要.doc
原创力文档

文档评论(0)