利用改进遗传算法的蛋白质三维折叠模拟的论文.docVIP

利用改进遗传算法的蛋白质三维折叠模拟的论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用改进遗传算法的蛋白质三维折叠模拟的论文.doc

  利用改进遗传算法的蛋白质三维折叠模拟的论文 【摘要】   根据氨基酸的序列预测蛋白质的空间结构在基因治疗药物分子设计等方面有巨大的潜在应用价值。本研究基于hp格子模型利用改进的遗传算法预测了蛋白质的三维空间结构。改进的遗传算法引入了克隆体数量限制策略、巢穴竞争选择策略及局部优化策略等。实验结果表明,改进的遗传算法显著地提高了蛋白质结构的预测效率,模拟的蛋白质结构紧凑,更接近真实蛋白质的构型。 【关键词】 遗传算法 蛋白质折叠 三维hp模型   1 引言   蛋白质是生命活动的重要承担者,蛋白质所具有的功能在很大程度上取决于其空间结构,掌握蛋白质的空间结构在基因治疗和药物分子设计方面有极大的潜在应用价值[1]。目前,测定蛋白质空间结构的方法主要是核磁共振和x射线衍射技术,这些技术消耗巨大,测定效率低下,远远满足不了日益增加的待测定海量蛋白质的需要[2]。根据氨基酸的序列,从理论上预测蛋白质的空间结构有助于提高测定蛋白质结构的效率,对生物医学的发展有重要的意义[3]。   蛋白质结构预测是个典型的“np问题”(算法的复杂性随着规模的增长成指数增长),也就是蛋白质的结构不能用一个多项式来明确表示,其能量的最小值必须通过启发式算法来搜索[4]。目前发展的启发式算法主要有蒙特卡罗模拟算法、禁忌算法、蚁群算法、链增长算法、模拟退火算法和遗传算法等[5~8]。.其中遗传算法由于高效地搜索效率得到了广泛的应用。   本研究针对hp模型(疏水性和亲水性格子模型)采用改进遗传算法模拟了蛋白质的三维空间折叠行为,改进的遗传算法主要引入了克隆体数量限制策略、巢穴竞争选择策略和局部优化策略等。   2 原理和方法   2.1 3dhp模型   最简单的蛋白质分子模型是hp格子模型,该模型把所有的氨基酸残基按疏水性和亲水性分成两类:疏水性残基(h)和亲水性残基(p)。因此,蛋白质序列被抽象为一个由h和p组成的序列[9]。hp格子模型在三维空间中的折叠简称3dhp模型,每个残基的折叠方向可以向左、向右、向上、向下90°或者向前,折叠的残基不能重叠在其它残基上,整个蛋白质序列在一个三维方格上折叠。3dhp模型的理论基础是氨基酸的疏水性是球蛋白形成的主要驱动力[2]。该模型忽略了侧链的影响,符合真实蛋白的基本特征。疏水性的氨基酸为了减小与水分子的接触面积而彼此靠近并进入分子的内部,形成了疏水相互作用;亲水性氨基酸则形成了分子的表面,形成紧密的团状构象。3dhp模型虽然过于粗糙,与真实蛋白分子相差甚远,但是它能模拟真实蛋白的折叠行为,且计算简单,有利于对比不同折叠搜索算法。   hp格子模型中,一个构象的能量计算规则如下:当两个在序列上不相邻的节点在空间上相邻时,便提供给构象一个相互作用能量.对于一个特定的序列结构,它的总能量e为:e=∑i<n,j<ni=1,j=i+1δreij,式中n为蛋白质序列的长度。如果i与j在空间中拓扑相邻但序列不相邻,那么δr等于1,否则等于0。eij表示在序列中第i个氨基酸与第j个氨基酸之间的能量。三维空间中拓扑相邻的残基有3种情形:hh、hp、pp,3种拓扑关系的能量规定如下[5]:ehh=-1.0, ehp=0.0, epp=0.0(1)由此,蛋白质三维折叠模拟的命题表述为:搜索蛋白质序列在空间中的结构,使该结构中拓扑相邻的hh数量最多。   上述的模型得到了广泛的应用,然而这种模型只考虑hh间的相互作用,而未考虑hp间的相互作用。实际的蛋白质结构是亲水性残基包裹疏水性残基形成球状结构,忽略hp间的相互作用将导致虽然找到了最多的hh接触数量,但是末端的疏水性分子p没有任何约束而随意折叠,蛋白质空间结构的自由度太大,甚至形成与真实蛋白质结构相差太远的结构。   实际3种拓扑关系的能量大小关系为:ehh<ehp<epp,本研究对3种拓扑关系做如下修正:ehh=1.0, ehp=-0.4, epp=0.0(2)这种修正考虑了氨基酸残基应满足的物理制约条件,不同类型的氨基酸残基趋向于分离,满足关系式[11]:2eηρ>eηη+epp(3)本研究中,个体适应度规定为:fi=-ei+0.01(4) 分 析 化 学第37卷第1期李绍新等:基于改进遗传算法的蛋白质三维折叠模拟 该规定保证了适应度总为正数,个体能量越低,适应度越大。增加的常量(0.01)保证了个别个体能量为零时适应度不为零,也有机会参与遗传操作。修正后的蛋白质三维折叠模拟命题表述为:寻求给定蛋白质序列具有最大适应度的三维空间结构。   2.2 遗传算法 遗传算法首先是由美国的holland教授提出来的启发式优化组合方法[12]。它基于达尔文进化论和孟德尔遗传学说,仿效生物的进化与遗传,根据“生存竞争”和“优胜劣汰”的原则,借助复制、交换、突变

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档