- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两种多序列比对的程序 Text-based or query-based searches: CDD, Pfam (pro), PROSITE [2] 还可以用手动方式对输入的一组蛋白质或核酸序列产生 多重比对。 Muscle, ClustalW, ClustalX [1] 多序列比对数据库,可以用文本或者任意序列进行搜索 Page 329 第二十八页,共四十六页。 BLOCKS CDD Pfam SMART DOMO (Gapped MSA) INTERPRO iProClass MetaFAM PRINTS PRODOM (PSI-BLAST) PROSITE 多序列比对数据库 These Use HMMs 第二十九页,共四十六页。 Pfam是综合的蛋白质家族数据库之一,可以用文本(关键字, 蛋白质名等)或序列数据进行搜索。 Pfam由两个数据库组成。Pfam-A是手工编辑、多重比对形式的 蛋白质家族集合。对于每一个家族,Pfam提供了4种特征:注释、 种子比对、pro、完全比对。完全比对可能很大,Pfam前 20个家族的完全比对都含有超过2500个序列。种子比对含有较少 数量的代表序列。除了由专家手工编辑的Pfam-A外,Pfam-B是从 ProDom数据库自动产生的。Pfam-B的数据质量、注释的完全程度 都不如Pfam-A,但是Pfam-B可以作为一个有用的补充。 Pfam:基于pro的蛋白质家族数据库 第三十页,共四十六页。 PFAM (protein family) database: .pfam.sanger.ac.uk/ Fig. 10.11 Page 331 第三十一页,共四十六页。 PFAM (protein family) text search result Fig. 10.12 Page 334 第三十二页,共四十六页。 PFAM GCG MSF format Fig. 10.13 Page 335 第三十三页,共四十六页。 本资料来源 第一页,共四十六页。 多序列比对 第二页,共四十六页。 主要内容 多序列比对的定义 ? 介绍多序列比对数据库 ? 介绍如何手动方式输入一组蛋白或核酸序列进行多重比对 第三页,共四十六页。 多序列比对的目的和定义 ? 多序列比对的目的;通过序列的相似性检索得到许多相关的 相似序列,将这些序列做一个总体的比对,以观察它们在序 列结构上的异同,以回答相关的生物学问题。 ?多序列比对就是将2条以上可能有系统进化关系的序列进行 比对。 ?一个多重比对就是一组可以部分或整体对齐的蛋白质或核酸 序列(3个或以上)。相同或相似的氨基酸残基排在同一列上, 这些对齐的残基在进化意义上是同源的:来自共同的祖先。在 三维结构中,对齐的残基也倾向于占据对应的位置。 第四页,共四十六页。 可以根据下面特征来确定是否对齐某些氨基酸 残基 ? 一些高度保守的残基(如参与形成二硫键的半胱氨酸) 形成保守膜体(motif),如跨膜结构域和免疫蛋白结构域 蛋白质二级结构的保守特征,如参与形成alpha螺旋、beta 片层和可变区的残基。 显示出一致插入或缺失模式的区域。 第五页,共四十六页。 多序列比对的典型应用 ? 大多数蛋白质家族中有远源的成员,与两两比对相比, 多序列比对能够更敏感地发现同源关系。 在检查某次数据库搜索结果时(如BLAST),多重比对形式 的结果能更容易显示保守残基和模体。 构建系统进化树的一个最关键的步骤就是多序列比对。 当一个物种的基因组被完整测序,数据分析的一个主要部分是 注释所有基因产物所归属的蛋白家族。数据库搜索进行高效的 多重比对,将每一个新蛋白(或基因)与其它所有家族的蛋白质 进行比较 很多基因的调节区含有转录因子结合的共有序列。 第六页,共四十六页。 多序列比对方法 Exact methods Progressive (ClustalW) Iterative (MUSCLE) Consistency (ProbCons) Structure-based (Expresso) 第七页,共四十六页。 多序列比对方法 Exact methods: dynamic programming Instead of the 2-D dynamic programming matrix in the Needleman-Wunsch technique, think about a 3-D, 4-D or higher order matrix. Exact methods give optimal alignments but ar
原创力文档


文档评论(0)