- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
同源模建及其分析工具的研究进展.doc
同源模建及其分析工具的研究进展
摘要:蛋白质的三级结构预测可通过同源模建、折叠识别、从头预测等方法进行,但同源模建应用最广泛,且最成熟。文章详述了同源模建的原理、方法步骤、常用工具,并对其应用前景进行了分析和讨论。
关键词:蛋白质结构预测;同源模建;分析工具
Abstract:Tertiary structure of proteins can be predicted by comparative modeling, fold recognition, de novo prediction methods, but comparative modeling is the most widely used and most matured methods. This paper describes the principles, process steps and common tools of comparative modeling, also its prospects are analyzed and discussed.
Key words:Protein structure prediction;Comparative modeling;Analysis tools
随着“人类基因组计划”的顺利完成,多种模式动植物基因序列的测定以及蛋白质工程技术的不断发展带来了大量的蛋白质一级结构的数据。而传统的蛋白质结构研究的手段主要是X射线晶体衍射、核磁共振等,使用这些技术进行蛋白质三级结构的测定不仅成本较高,效率还相当低下,而且由于技术发展的局限,实验中还有许多问题没有解决。截至2014年10月,TrEMBL中收录的蛋白质序列达,SwissProt中经过手工修正的序列达546439条(http:///)[1]。相比而言,PDB蛋白结构数据库 (http:///pdb/home/home.do)[2]的结构数据只有103921个,相差巨大。为了充分地理解蛋白是如何执行功能以及根据蛋白结构设计出更合理的药物,能否获得蛋白的结构甚至预测其结构就显得尤为重要,这些都使从理论上对一个已知序列的蛋白质的空间结构进行预测的问题变得日益紧迫和重要。
目前,常用的蛋白结构预测方法分为三类:①针对高相似序列的同源模建(homology modeling,也称比较建模);②针对较低序列相似性的折叠识别(fold recognition,也称穿线法);③不依赖于模板而利用物理学原理直接进行从头计算(ab initio)。其中第一种方法完全依赖模板,第二类方法适合于无法准确找到模板,但存在相同折叠的情况。现今,第一种和第二种方法的分类逐渐模糊。第三类方法则完全依赖分子动力学计算来预测,不需要模板。如今,同源模建已完全成熟到自动化,可以为科研工作者提供可靠的模型。
2同源模建
同源模建通过挑选与目标序列具有同源性的且结构已知的蛋白质作为模板来建立其三维结构。同源是指一些蛋白质从相同的祖先进化而来,而并不是指序列相似或者结构相似,虽然同源蛋白质在某种程度上具有相似的序列和结构。同源模建主要有4个步骤:模板搜寻、序列比对、目标模型的创建和结构优化。尽管每一步都可能造成错误而影响结果的准确性,但是模板搜寻和序列比对是影响模型最终质量的最显著决定因素。通常,在同源模建的过程中,模板搜寻也提供了序列-结构比对。在下面的讨论中,我们将模板搜索和序列-结构比对放在一起。同源模建的局限性在于蛋白序列和已解析的蛋白的序列一致性(identify)大于30%时,所得的结果才会比较可靠。最近的方法将模板搜寻和序列比对进行了优化,同时提高了搜索的灵敏度和比对的准确性,正在逐渐克服这些局限。
2.1 模板搜寻和序列比对 同源模建的第一步就是确定一个或者多个模板结构。通过将目标序列作为查询序列,扫描结构数据库(如PDB、SCOP、DALI和CATH等),搜索与目标蛋白具有相似性的模板。检测到的相似性通常用序列一致性或其他的统计方法计算,如E值或Z值。
序列-结构的关系被划分为3种不同的层次:①序列一致性30%,易检测到同源性;②序列一致性在10%~30%之间;③统计学上无显著的序列相似性。
当序列一致性大于30%~40%时,用各种方法所产生的比对基本上都是正确的。在这种情况下,最快的选择合适模板的方法是简单的双序列比对法(sequence?Csequence法),例如SSEARCH、BLAST和FASTA。Brenner[3]等人发现,当序列一致性在30%~40%时,此方法可以检测到90%的同源对。
当蛋白质的一致性在10%~30%之间时,蛋白质搜索的敏感性和比对的准确性会降低很多
您可能关注的文档
- 变阻器两种接法的比较与选择.doc
- 变革大潮中,美国汽车产业发展的知与惑.doc
- 变革时代新领导力.doc
- 变革者UBER.doc
- 变频器电气干扰原因及预防浅谈.doc
- 变频燃烧器的电气原理与应用分析.doc
- 变风量空调控制系统的设计与应用.doc
- 叙事理论视角下的政治语篇翻译.doc
- 口服中药汤剂所致不良反应的原因分析及对策.doc
- 口服孟鲁司特钠、雾化吸入布地奈德联合治疗毛细支气管炎患儿及对患儿血液中免疫功能的影响.doc
- 上海海洋大学《海洋环境分析技术》课件-21化学发光分析法.pdf
- 上海海洋大学《海洋环境分析技术》课件-20分子荧光分析法.pdf
- 上海海洋大学《海洋环境分析技术》课件-22色谱分离过程.pdf
- 上海海洋大学《海洋环境分析技术》课件-25气相色谱仪与固定液.pdf
- 上海海洋大学《海洋环境分析技术》课件-24色谱定性定量方法.pdf
- 上海海洋大学《海洋环境分析技术》课件-26气相色谱检测器.pdf
- 上海海洋大学《海洋环境分析技术》课件-29液相色谱固定相与流动相.pdf
- 上海海洋大学《海洋环境分析技术》课件-27气相色谱分离条件的选择.pdf
- 上海海洋大学《海洋环境分析技术》课件-28液相色谱仪器与类型.pdf
- 上海海洋大学《海洋环境分析技术》课件-3 原子光谱和分析光谱.pdf
文档评论(0)