蛋白质功能-结构-相互作用预测网站工具合集.docxVIP

  • 40
  • 0
  • 约9.38千字
  • 约 14页
  • 2022-06-06 发布于江苏
  • 举报

蛋白质功能-结构-相互作用预测网站工具合集.docx

蛋白质功能-结构-相互作用预测网站工具合集 蛋白质组学 蛋白质是生物体的重要组成部分,参与几乎所有生理和细胞代谢过程。此外,与基因组学和转录组学比较,对一个细胞或组织中表达的所有蛋白质,及其修饰和相互作用的大规模研究称为蛋白质组学。 蛋白质组学通常被认为是在基因组学和转录组学之后,生物系统研究的下一步。然而,蛋白质组的研究远比基因组学复杂,这是由于蛋白质内在的复杂特点,如蛋白质各种各样的翻译后修饰所决定的。并且,研究基因组学的技术要比研究蛋白质组学的技术强得多,虽然在蛋白质组学研究中,质谱技术的研究已取得了一些进展。 尽管存在方法上的挑战,蛋白质组学正在迅速发展,并且对癌症的临床诊断和疾病治疗做出了重要贡献。几项研究鉴定出了一些蛋白质在乳腺癌、卵巢癌、前列腺癌和食道癌中表达变化。例如,通过蛋白质组学技术,人们可以在患者血液中明确鉴定出肿瘤标志物。表1列出了更多的蛋白质组学技术用于研究癌症的例子。 另外,高尔基体功能复杂。最新研究表明,它除了参与蛋白加工外,还能参与细胞分化及细胞间信号传导的过程,并在凋亡中扮演重要角色,其功能障碍也许和肿瘤的发生、发展有某种联系。根据人类基因组研究,约1000多种人类高尔基体蛋白质中仅有500~600种得到了鉴定,建立一条关于高尔基体蛋白质组成的技术路线将有助于其功能的深入研究。 基因功能预测的方法,这些方法旨在超越传统的BLAST搜索来预测基因的功能。基因功能预测可以以氨基酸序列、三级结构、与之相互作用的配体、相互作用过程或基因的表达方式为基础。其中最重要的是基于氨基酸序列的分析,因为这种方法适合于微阵列分析的全部基因。 在表3中,前三项列举了三种同源搜索方法。FASTA方法虽然应用还不太广泛,但它要优于BLAST,或者至少相当。FASTA程序是第一个使用的数据库相似性搜索程序。为了达到较高的敏感程度,程序引用取代矩阵实行局部比对以获得最佳搜索。美国弗吉尼亚大学可以提供这项程序的地方版本,当然数据库搜索结果依赖于要搜索的数据库序列。如果最近的序列数据库版本在弗吉尼亚大学不能获得,那么就最好试一下京都大学(Kyoto University)的KEGG站点。PSI-BLAST(位点特异性反复BLAST)是BLAST的转化版本,PSI-BLAST的特色是每次用profile搜索数据库后再利用搜索的结果重新构建profile,然后用新的profile再次搜索数据库,如此反复直至没有新的结果产生为止。PSI-BLAST先用带空位的BLAST搜索数据库,将获得的序列通过多序列比对来构建第一个profile。PSI-BLAST自然地拓展了BLAST方法,能寻找蛋白质序列中的隐含模式,有研究表明这种方法可以有效地找到很多序列差异较大而结构功能相似的相关蛋白,所以它比BLAST和FASTA有更好的敏感性。PSI-BLAST服务可以在NCBI的BLAST主页上找到,还可以从NCBI的FTP服务器上下载PSI-BLAST的独立程序。在检查PSI-BLAST的搜索输出时,也有一些注意事项,因为假的匹配记录很容易污染分析结果。 ? 表3 蛋白质功能预测工具 预测工具 类型 所在地 网站 BLAST 同源搜索 NCBI:美国国立生物技术信息中心;NIH:美国国家医学研究院 /BLASTselect protein-protein BLAST FASTA 同源搜索 美国弗吉尼亚大学、日本京都大学 http://fasta.genome.jp/ PSI-BLAST 同源搜索 NCBI:美国国立生物技术信息中心;NIH:美国国家医学研究院 /BLASTselect “PSI- and PHI-BLAST” Pfam 蛋白质家族鉴定 华盛顿大学 SMART 保守结构域搜索 EMBL:欧洲分子生物学实验室 http://smart.embl-heidelberg.de PROSITE 功能模体搜索 瑞士生物信息研究所 /prosite http://motif.genome.ad.jp ELM 真核生物功能结构域搜索 ELM 联合体 STRING 通过比较基因组学进行功能预测 EMBL(欧洲分子生物学实验室) http://string.embl.de PSORT 亚细胞定位预测 人类基因组中心东京大学 PFP 通过发掘PSI-BLAST结果进行功能预测 美国普渡大学 /pfp ? Pfam数据库(Protein families database of alignments and HMM, 蛋白质家族比对和HMM数据库)是基于HMM模型(隐马尔可夫模型)构建并拓展起来的。它实际上是一个涵盖了生物蛋白质序列中常见结构域的序列及其相对应的隐马尔科夫模型的数据库,由英国的Sang

文档评论(0)

1亿VIP精品文档

相关文档