《生物信息学》第五章:蛋白质结构预测与分析(第二部分)
计算方法预测三级结构:同源建模法 SWISS-MODEL
预测蛋白质三级结构的首选方法是同源建模法(homolog modeling)。该方法基于原理:
相似的氨基酸序列对应着相似的蛋白质结构。比如三个蛋白质,它们在序列水平上十分相似,
解析出的结构也十分相似。第四个蛋白质的序列和前面三个也高度相似,那么就可以比着前
三个结构的样子“画”出第四个的样子。所以同源建模法的关键就是找到一个好的模板。好
的模板要求,在序列水平上模板(template)要与目标(target)蛋白质具有超过 30%的一致
度。同源建模法操作流程如下(图 1):
图 1. 同源建模法操作流程
1. 确定模板:找到与目标蛋白质同源的已知蛋白质结构作为模版(目标序列与模版序
列间的一致度要≥30%)。
2. 序列比对:为目标序列与模板序列创建序列对比。模板可以选取多个,通过做多序
列比对,各取所长,让模板序列中与目标序列相似的片段尽可能多的覆盖整个目标序列,同
时要尽量避免没有模板参考的断口。
3. 计算模型:通过序列比对,将目标序列里的氨基酸替换到模板结构里对应的氨基酸
所在的空间位置上。这一步通过同源建模软件来实现。
4. 质量评估:同源建模软件输出结构模型后还需要进行质量评估,并根据评估结果更
换模板或修正序列比对,重新构建模型,再次评估。重复这个过程,直至模型质量合格为止。
SWISS-MODEL()是一款常用的全自动同源建模在线软件。
它能帮助完成上述步骤中从模板选取到创建序列比对,再到计算模型,以及最后的质量评估
的全部过程。你需要做的只是:输入目标序列,点 Build Model(创建模型)(图 2 左)。大约
三到五分钟之后就会返回结果。
如果这种自动挡模式不能满足你的要求,可以通过点击 Search For Templates 切换成手动
挡,以便指定模板。也可以直接把做好的目标序列与模板序列之间的序列比对按照指定格式
黏贴到输入框里,再点击 Build Model(创建模型)(图 2 右)。这时,SWISS-MODEL 会根据
输入的特定格式的序列比对,识别出哪个是目标序列,哪个是模板,并自动从 PDB 数据库
下载模板结构,最后根据输入的比对计算结构模型。
图 2. 输入目标序列(左)与输入目标序列和模板序列之间的序列比对(右)
我们以图 2 中左图为例,只输入目标序列(示例文件:SwissModel.fasta),点击 Build Model
(创建模型)。得到结果页面如图 3 所示。
图 3. SWISS-MODEL 结果页面
从结果页面里可以看到,SWISS-MODEL 挑选了 PDB ID 为 IFYV 的结构作为模板,它
和我们输入的目标序列之间的一致度是 36.18%,大于 30%,满足同源建模的基本条件。结
果中还给出了目标序列和模板序列之间的序列比对。点击 中的下拉箭头,可
以下载预测模型的 PDB 文件。从序列比对和概览图上都可以看到,模板序列较目标序列短
了一点,即,模板序列没有能覆盖目标序列两端的部分,所以模型两端的质量并不高,但是
模型整体的质量按照 SWISS-MODEL 自己的评估是合格的。这一点可以通过 QMEAN 打分
获知。
如果目标序列与模板序列一致度极高,那么同源建模法是最准确的方法(图 4)。如果
一致度如果达到 30%,那么模型的准确度就可以达到 80%,模型可以用于寻找功能位点以及
推测功能关系等。如果一致度达到 50%,模型准确度就可以达到 95%,可以根据模型设计定
点突变实验,甚至可以做晶体结构置换,也就是辅助完成真实结构的测定。如果一致度达到
70%以上的话,我们基本就可以认为预测模型完全代表了真实结构,并可以用它进行虚拟筛
选
原创力文档

文档评论(0)