格子模型的快速序列搜索算法.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
格子模型的快速序列搜索算法

格子模型的快速序列搜索算法水 30074)李小妹王能超 武汉华中科技大学计算机科学与技术学院(4 摘 要:一种快速序列穷举搜索蛋白质构像空间的算法。该算法利用二分技术将HP序列逐次 分解,保存分解过程的中间结果,使搜索算法中所需的计算量大大减少。 关键词:格子模型完全二叉连接树二分技术HP序列 蛋白质是通过共价键将各种氨基酸的基本原子连接 二叉连接树算法对长为Ⅳ的HP序列的搜索,加速因子可 在一起的大分子。蛋白质的结构决定了其性能,因此理解 达到2Ⅳ。 蛋白质的结构和性能的关系至关重要。1973年Anfinsen1快速序列搜索算法 通过试验得出蛋白质的氨基酸序列在失性后可自发恢复 HP序列是由疏水和亲水二种氨基酸组成。很明显,对 其天然构像,并通过该试验得到二个结论:(1)对大部分单 长为Ⅳ的HP序列可以用…0’(亲水残基)和“1”(疏水残 域蛋白质而言,编码蛋白质的氨基酸序列就可以决定它 基)字串表示: 的空问构像;(2)蛋白质的天然构像选择的是能量最低的 A=(ol,a2,a3,^,aN) 结构。 其中:A表示长为Ⅳ的序列,a。表示第i个残基的疏水 基于这一理论,人们提出了用全原子模型来进行蛋白 特性值。 质折叠模拟。该模拟涉及大量原子以及复杂的原子力场模 HP序列折叠为某一结构的能量可采用氨基酸类型在 型,所需的计算量庞大,目前的计算能力无法达到。格子模 结构中的埋藏度分布和表示: 型是一种极为简化的蛋白质结构模型。在格子模型中,一 N 1_ E=一二aisi 个蛋白质的结构是由多个结点组成的连在二维或三维的 |-1 正方格子空问的自回避行走所得的路径来表示。格子模型 其中:s。表示结构中第i个残基在格子模型中的埋藏 必须满足二个限制条件:(1)氨基酸序列中的共价键不能打 度,如图1所示。结构格点可以分为四类:心点(图中用黑色 断;(2)每个氨基酸占据一个格点,但一个格点不能被两个 表示)、面点(图中用黑灰色表示)、边点(图中用亮灰色表示) 氨基酸同时占用。 和角点(图中用白色表示),分别用四种不同的参数值来表 由于组成蛋白质的氨基酸共有20种,所以长为Ⅳ的 示。为了简化能量计算,也可将心点和面点归为一类,边点 蛋白质即有20“种序列,进行序列的穷尽搜索不现实。虽 和角点归为一类,用二个参数值表示。对本算法而言,使用 然氨基酸有不同的理化性质,但最重要的差异在于疏水性 何种表示方式对算法的计算量都不会有影响。通过这种表 能。因此可以把氨基酸分成疏水氨基酸H和亲水氨基酸P 示,把能量的计算变成了二个向量的内积取负值。其表示公 二种。这样,格子模型在结构空间和序列空间都作了最大 式为: 的简化,同时保留了蛋白质最基本的结构特性。天然蛋白 E=-A·S 质,特别是球蛋白,采用的都是致密的结构。所以,利用格 在序列的穷尽搜索中包含大量的重复计算,如二个长 子模型进行穷举搜索时,一般只搜索其致密结构。致密结 构数与格子模型的格点多少、位置关系以及模型的维数有 关。利用此模型可以对序列空间2“进行完备的描述及穷 构序列进行计算时,前面16位的计算结果为重复计算。这 举化搜索,从而可以对天然蛋白质结构与序列的关系进行 时,可以把前面已经计算的中间结果存储起来,以便后面直 理论分析。很显然,穷举搜索会随着格点和维数的增加使 接取用。亦即将16位后面的各位进行二分,计算时直接取 计算量变得非常大。因此,本文构造一种有效的快速结构 用前面的结果。推广到一般的情形,可以在每一位的后面 穷举搜索算法,大大降低了其计算量。经实验验证,该快速

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档