华中农业大学生物信息学课件Bioin04.pptVIP

华中农业大学生物信息学课件Bioin04.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于速度方面的考虑(网速、等待时间),优先使用ncbi blast,但是ebi也有很多优点 * * * * * CUCCCUCCGUCCCACAAUAUAAGGGAUUUUGAGUUUUCGAUUGCAGUGUUUGACCACUCGUCUUAUUCAAAUUUUUUUUGUAAAUAUAAAAAAUGAAAAGUUGUGCUUAAAGUACUGUAUAUAAUAAAGUAAGUCACAAAUAAAAUAAAUAAUAAUUUCAAAAAAAAAAUGAAUAAAACGAGUGGUCAAACGUUGCAAACAAAAACUCAAAAUCCCUUAUAUUAUGGGAUGGAGGGAG * /content/31/13/3537.full Figure 1.?Multiple alignment of coding DNA. (A) How?alignment at the DNA level may lead to incorrectly aligned codon–codon boundaries. (B) How alignment of coding DNA at the amino acid level yields an alignment where analogous codon positions are properly lined up. The encoded amino acids are indicated at the bottom of (B) * /etblast3/ * * * * * * * * * * 事实上,积分体系的内在原理是概率论,分值是与偶然排列相比的概率比值的对数形式(所以可以相加log(P1*P2*P3)=log(P1)+log(P2)+log(P3)=4+1+(-3)=2)。可以这么认为:18分表示2^(18/2)=512倍于偶然的期望值. 公式为2^(Score/2)。 * PAM:Point/percent accepted mutation, by Dayhoff 被进化所接受的点突变 BLOSUM: Blocks substitution matrix (PNAS, 1992) 基于较易比对的近缘物种的蛋白构建。BLOSUM更新,使用的数据量更大些,优先考虑。 BLOSUM是根据比对的保守区块中aa的变化构建的(局部比对),所以更适合发现蛋白质的保守区块。BLOSUM所有数据均来源于直接实验观察的结果,比如BLOSUM62源于60%左右同一性的基因家族成员之间的比对。BLOSUM80就是80%同一性。 PAM比对的所有aa都用上了(相似度85%序列的全局比对,共获得1572个变异)。PAM1数据来源于实验,而PAM250则是PAM1自乘250次得到,用于表征远缘序列。 这些矩阵都是对称的,因为无法确认是A-B还是B-A,所以认为概率上一样。 有意思的是,有研究表明BLOSUM62作者存在计算错误,但是确实很好用:Mark P Styczynski; Kyle L Jensen, Isidore Rigoutsos, Gregory Stephanopoulos (2008). BLOSUM62 miscalculations improve search performance. Nat. Biotech. 26 (3): 274–275. doi:10.1038/nbt0308-274. PMID * 基于相似性记分,可以提供两条序列相似性的评价 换个角度,还可以有距离记分,强调一条序列需要变化多少次才能变成另一条。这种记分可以用于进化分析,下节课讲。 * /wiki/Sequence_alignment 两条序列间可能的对位排列方式为(2^(2N))/sqrt(pi*N),其中N为较长的序列的长度。N=250时有10^149种,远远大于宇宙内所有原子的总数。 Needleman-Wunsch Algorithm: global alignment Smith-Waterman Algorithm: local alignment /wiki/File:Zinc-finger-dot-plot.png using the publicly available?DNAdot?tool 点阵分析还通常用于RNA二级结构分析,易于鉴别发卡结构 动态规划:/users/CH391L/Handouts/Lecture5-NBT-primer-dynamicprogramming.pdf 测试: CGGATCAT CTCAACT Sequence A: CAATTGA Sequence B: GAATCTGC * /wiki/BLAST

文档评论(0)

ma982890 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档