网站大量收购独家精品文档,联系QQ:2885784924

中南民族大学研究生生物信息学05第5课多序列联配.pptVIP

中南民族大学研究生生物信息学05第5课多序列联配.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中南民族大学研究生生物信息学05第5课多序列联配

多序列比对可以阐明家族性蛋白质和核苷酸序列中的内在关系。 与两序列联配相比,多序列联配更富含进化保守关系的信息,因此通常能告诉我们更多的信息。例如,两个同样的氨基酸残基可以在两条蛋白序列间联配;但事实上这些残基没有发生突变的原因可能是偶然的;另一方面,如果一个残基在一个家族所有序列中都是保守的,而该家族的序列相互间又不同时,就意味着该残基可能起着关键的结构或功能作用。 能表明两条或两条以上序列之间的关系。当所考察的序列不同时,保守的残基往往是维持稳定结构或生物学功能的关键残基。多序列联配可以揭示关于蛋白质结构和功能的许多线索。 蛋白质家族和模式数据库 一致序列: 这些序列把多序列联配的信息压缩至单条序列。主要的缺点是除了在特定位置最常见的残基之外,它们不能表示任何概率信息。一致序列的产生说明了任何蛋白家族的表示都是有偏向的,这主要是由于来源的序列集是有偏向的。 以凝血酶(THRB)和因子9(FA9)序列为例,从多序列联配中产生一致序列。 一致序列中每个位点对应于联配的一列。如果某残基为60%以上的序列所共有,则设其为一致残基,否则记为X。60%这个阈值通常是可变的。 PROSITE序列模式数据库 PRINTS和BLOCKS PRINTS和BLOCKS是密切相关的。它们分别通过来自一组蛋白或蛋 白家族中最高度保守区域的多序列联配无空位片段的形式采表示蛋白质 家族。这种多序列联配无空位片段分别定义为blocks(在BLOCKS中)或 motifs(在PRINTS中)。PRINTS中这种motif集代表一种称为finger-print的 家族。PRINTS数据库质量非常高,它由 大量的人工工作创造,包含 关于蛋白质家族和功能的详尽注释和描述。 最初的BLOCKS版本由自动的方法产生,但现在许多数据库(包括 PRINTS)都以BLOCKS的格式存在。下图显示了SH3结构域的PRINTS 条目的例子。PRINTS通过覆盖SH3区域多序列联配中最保守区域的4个 motifs来表示这个区域。 . 这些数据库中的motifs要比PROSITE模式覆盖更大的序列区域。 PRINTS和BLOCKS模式的匹配比PROSITE模式的匹配更为敏感 (可以找到更多远距离关系)和更加特异(更少的假阳性出现)。 序列轮廓:(又称为权重矩阵) 它们表示完全结构域序列,多序列联配中每个位 点的氨基酸都有分值,并且特定位置插入或缺失的 可能性均有一定的衡量方法。序列轮廓可以被用作 某些PROSITE数据库条目中序列模式之外的其他方 法。其主要优点是描述了结构域序列的全长,包括 观察到每个氨基酸的可能性,以及序列每个位点插 入和缺失的可能性。 * F 多序列联配:基因和蛋白质家族 思考题: 多序列比对的作用 一致序列、权重矩阵的定义 Internet 上的许多网站具有ClustalW分析软件 可以免费下载 对要分析的序列的输入格式有要求,FASTA(Pearson)格式 sequence 1 ATTGCAGTTCGCA …… sequence 2 ATAGCACATCGCA…… 可修改分析参数 在ClustalW 网页的 “Parameters”修改参数 点击“align”重新排列序列 部分参数定义 Gap opening penalty:增大数值使 gap 数目减少 Gap extention penalty:增大数值使 gap 长度变短 Weight transition:A-G 转换或 C-T 转换(multiple DNA sequence alignment) Hydrophilic gap:选择“ on” 将增加形成 gap 的机会(multiple protein sequence alignment) Residue-specific gap penalties:选择“ on” 将增加在某些氨基酸残基处形成 gap 的机会,而减少在另一些氨基酸残基处形成 gap 的机会(multiple protein sequence alignment) 可进一步对排列好的序列进行修饰(2) 在EBI的ClustaW分析网页(http://www.ebi.ac.uk/ clustalw/index.html)输入序列 “ClustalW Results”网页展示多序列对位排列结果 点击“Show Colors”用不同颜色的字母展示对位排列结果 颜色修饰 功能,突出相同或相似位点 ① ② PROSITE模式有很多缺点:首先,它们长度较短使得不相关序列中有假阳性的存在。且这种效应不仅仅局限于与翻译后 修饰有关的较短模式。其次,虽然它们允许描述特定位置的变化,但无法计算该变化的概率。 *

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档