- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
格子模型的快速序列搜索算法
格子模型的快速序列搜索算法水
30074)李小妹王能超
武汉华中科技大学计算机科学与技术学院(4
摘 要:一种快速序列穷举搜索蛋白质构像空间的算法。该算法利用二分技术将HP序列逐次
分解,保存分解过程的中间结果,使搜索算法中所需的计算量大大减少。
关键词:格子模型完全二叉连接树二分技术HP序列
蛋白质是通过共价键将各种氨基酸的基本原子连接 二叉连接树算法对长为Ⅳ的HP序列的搜索,加速因子可
在一起的大分子。蛋白质的结构决定了其性能,因此理解 达到2Ⅳ。
蛋白质的结构和性能的关系至关重要。1973年Anfinsen1快速序列搜索算法
通过试验得出蛋白质的氨基酸序列在失性后可自发恢复 HP序列是由疏水和亲水二种氨基酸组成。很明显,对
其天然构像,并通过该试验得到二个结论:(1)对大部分单 长为Ⅳ的HP序列可以用…0’(亲水残基)和“1”(疏水残
域蛋白质而言,编码蛋白质的氨基酸序列就可以决定它 基)字串表示:
的空问构像;(2)蛋白质的天然构像选择的是能量最低的 A=(ol,a2,a3,^,aN)
结构。 其中:A表示长为Ⅳ的序列,a。表示第i个残基的疏水
基于这一理论,人们提出了用全原子模型来进行蛋白 特性值。
质折叠模拟。该模拟涉及大量原子以及复杂的原子力场模 HP序列折叠为某一结构的能量可采用氨基酸类型在
型,所需的计算量庞大,目前的计算能力无法达到。格子模 结构中的埋藏度分布和表示:
型是一种极为简化的蛋白质结构模型。在格子模型中,一 N
1_
E=一二aisi
个蛋白质的结构是由多个结点组成的连在二维或三维的 |-1
正方格子空问的自回避行走所得的路径来表示。格子模型 其中:s。表示结构中第i个残基在格子模型中的埋藏
必须满足二个限制条件:(1)氨基酸序列中的共价键不能打 度,如图1所示。结构格点可以分为四类:心点(图中用黑色
断;(2)每个氨基酸占据一个格点,但一个格点不能被两个 表示)、面点(图中用黑灰色表示)、边点(图中用亮灰色表示)
氨基酸同时占用。 和角点(图中用白色表示),分别用四种不同的参数值来表
由于组成蛋白质的氨基酸共有20种,所以长为Ⅳ的 示。为了简化能量计算,也可将心点和面点归为一类,边点
蛋白质即有20“种序列,进行序列的穷尽搜索不现实。虽 和角点归为一类,用二个参数值表示。对本算法而言,使用
然氨基酸有不同的理化性质,但最重要的差异在于疏水性 何种表示方式对算法的计算量都不会有影响。通过这种表
能。因此可以把氨基酸分成疏水氨基酸H和亲水氨基酸P 示,把能量的计算变成了二个向量的内积取负值。其表示公
二种。这样,格子模型在结构空间和序列空间都作了最大 式为:
的简化,同时保留了蛋白质最基本的结构特性。天然蛋白 E=-A·S
质,特别是球蛋白,采用的都是致密的结构。所以,利用格 在序列的穷尽搜索中包含大量的重复计算,如二个长
子模型进行穷举搜索时,一般只搜索其致密结构。致密结
构数与格子模型的格点多少、位置关系以及模型的维数有
关。利用此模型可以对序列空间2“进行完备的描述及穷 构序列进行计算时,前面16位的计算结果为重复计算。这
举化搜索,从而可以对天然蛋白质结构与序列的关系进行 时,可以把前面已经计算的中间结果存储起来,以便后面直
理论分析。很显然,穷举搜索会随着格点和维数的增加使 接取用。亦即将16位后面的各位进行二分,计算时直接取
计算量变得非常大。因此,本文构造一种有效的快速结构 用前面的结果。推广到一般的情形,可以在每一位的后面
穷举搜索算法,大大降低了其计算量。经实验验证,该快速
您可能关注的文档
- 有限闭区间的最小覆盖数.pdf
- 服务业和服务贸易的几个问题.pdf
- 有限元方法的历史.ppt
- 服饰陈列之服装陈列货架最常用的12种陈列知识.pdf
- 有理数的乘法第2课时王冲.ppt
- 期末2009-2010第一学期期末.doc
- 期末复习试卷-统计,概率,逻辑》.doc
- 木材热解产品项目可行性研究报告资金申请用(通过版).pdf
- 木浆源甾醇对高脂高胆固醇膳食饲喂仓鼠肠道胆固醇调控及 菌群的影响.pdf
- 服务营销与关系营销.pdf
- 2025年安全监察人员检测卷含完整答案详解(典优).docx
- 2025年安全员考试通关题库附完整答案详解(夺冠).docx
- 2025安全监察人员通关考试题库及完整答案详解(考点梳理).docx
- 安全监察人员题库试题及完整答案详解(名师系列).docx
- 安全监察人员考前冲刺测试卷【预热题】附答案详解.docx
- 安全监察人员试题附参考答案详解(突破训练).docx
- 2025年安全监察人员每日一练试卷附参考答案详解【名师推荐】.docx
- 安全监察人员考试黑钻押题附参考答案详解(能力提升).docx
- 2025年安全监察人员通关题库及完整答案详解(名校卷).docx
- 2025年安全监察人员考试历年机考真题集【典优】附答案详解.docx
最近下载
- 院感知识试题(附答案).docx VIP
- 分布式光伏电站屋顶租赁协议(标准范本).docx
- 高温防暑安全培训课件.pptx VIP
- 11SG534带水平段钢斜梯(45°)(OCR).pdf VIP
- 一升二数学《暑假作业》 每日一练.docx VIP
- 《商务-谈判》课程标准).doc VIP
- 对我国长距离浆体管道输送工程设计的思考-论文发表.PDF VIP
- 110(66)kV~500kV架空输电线路运行规范.ppt VIP
- 牛津译林版九年级上册英语Unit 1-Unit 8语法知识点复习提纲.pdf VIP
- 《GBT20001.3-2015标准编写规则第3部分:分类标准》(2025版)深度解析.pptx
文档评论(0)