第五章 多序列比对课件.pptVIP

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
什么是多序列比对? 3条或以上的氨基酸(核酸)序列比对; 序列所有残基的相对位置保持不变,将不同序列间相同或相似的残基放入同一列, 即尽可能将序列间相同或相似残基上下对齐; 对齐的残基在进化上同源。 多序列比对的应用 用于描述一组序列之间的相似性关系,寻找保守区域,了解一个基因家族的基本特征。 用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。 多序列比对的渐进比对过程 简单过程: 1. 先对所有的序列进行两两比对并计算它们相似性得分,并根据相似性分值将它们分成若干组 2. 然后,逐渐地加上较小相关的序列或者序列组 合…,直到得到最终比对结果。 渐进法多序列比对——Clustal W/X 对所有序列两两全局比对( Needleman-Wunsch算法),计算得到一个距离矩阵,该矩阵反映每对序列的关系; 用距离矩阵构建比对指导树; 根据指导树的分支顺序,关系最近的两序列开始比对,由近至远,逐步添加序列,直到所有序列全部加入为止。 Clustal W/X多序列比对步骤 1 Clustal W/X多序列比对步骤 1 Clustal W/X多序列比对步骤 2 Clustal W/X多序列比对步骤 3 ClustalW/X:存在的问题 最终的比对结果非常依赖起始两两序列比对,如果这些序列在进化中相近,比对结果是非常好。 ——例如,距离最近的有两组序列AB和CD,以AB为准,加入CD,然后再加上其他序列,还是CD为准,最终结果可能出入很大 当序列差异较大时,依赖起始两两比对更加明显。 例如 三条序列: Seq1,2先比对,再加入Seq3: Seq1,3先比对,再加入Seq2: Seq2,3先比对,再加入Seq1: ClustalX: 使用指南 FASTA序列格式,多序列 导入序列文件 调整比对参数 执行比对 文件导出 多序列比对:结果查看 GeneDoc和BioEdit等软件 多序列比对:结果查看 两两序列比对方式检索数据库的局限 多序列方式检索数据库 HMMER软件包 建立 HMM模型流程 ClustalW/X进行多序列对齐 HMM模型检索序列数据库 HMM模型检索序列数据库: 适用于已知某一类蛋白质的保守结构,通过构建HMM模型,从序列数据库中搜索所有该类蛋白序列。 程序格式: hmmsearch [options] hmmfile seqfile HMM模型检索序列数据库举例 WRKY基因是一类植物特有转录因子,其特点至少含有一段60个左右的高保守氨基酸序列。 WRKY HMMs检索拟南芥蛋白数据库结果 WRKY HMMs检索拟南芥蛋白数据库结果 WRKY HMMs检索拟南芥蛋白数据库结果 检索结果统计 HMM模型 程序格式: hmmsearch WRKY.hmm ATH.pep 通过构建剖面HMM模型(WRKY.hmm),从拟南芥蛋白数据库中搜索所有该类蛋白序列。 score obs. exp. http://pfam.sanger.ac.uk/ HMM的应用实例——pfam数据库 序列检索HMM模型数据库,主要应用于序列的功能预测 HMM的应用实例——pfam数据库 http://smart.embl-heidelberg.de/ HMM的应用实例——SMART数据库 HMM的应用实例——SMART数据库 * 第五章 多序列比对 农业与生物学院 张利达 zhangld@ S1 AKRSCD S2 TKMRSED S3 AKRSD S4 TKRSED 两两全局比对,构建序列距离矩阵 6组序列两两全局比对 S1 S2 S3 S4 S1 - S2 50 - S3 80 40 - S4 66 66 60 - 4条序列两两比对数: (3)(4)/2 = 6 N条序列两两比对数: (N-1)(N)/2 两两全局比对,构建序列距离矩阵 S1 S2 S3 S4 S1 - S2 0.5 - S3 0.2 0.6 - S4 0.34 0.34 0.4 - 序列相似性得分转换成序列距离 S1 S2 S3 S4 S1 - S2 50 - S3 80 40 - S4 66 66 60 - S2 S4 S1 S3 根据序列关系矩阵,构建指导树(guide tree) ClustalW/X生成的指导树表明序列间的距离关系; 指导树并非序列系统进化树。 S1 S2 S3 S4 S1 - S2 0.5 - S3 0.2 0.6 - S4 0.34 0.34 0.4 - S1 AKRSCD S3 AKRS-D S4 TK-RSED S2 TKMRSED S1

文档评论(0)

aqlsxc66163 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档