MODELLER讲课.docx

下载文档 降价啦

45
0
约1.13万字
约 26页
2017-05-06 发布于湖北
举报
版权申诉
保障服务

MODELLER讲课.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基本示例：阴道毛滴虫乳酸脱氢酶的单模板建模一个新型的关于乳酸脱氢酶的基因从阴道滴虫（TVLDH）中被确定下来。与其它的乳酸脱氢酶蛋白相比，这个类似蛋白与这个物种（阴道滴虫）的苹果酸脱氢酶（TvMDH）有着更高的相似性。我们假定通过相对近的时期的趋同进化，TVMDH从TvLDH中衍生了出来。为了研究这个序列的结构背景，并对一个通过定点突变来阐明在酶特异性的趋同进化的表观假设中的特异性改变的实验提出建议，我们对TvLDH与TvMDH建立了比较模型。天然的与突变后的酶表达后，对它们的活性进行了比较。 TvLDH相关结构的搜索首先，需要将目标TvLDH序列转化为MODELLER能读取的PIR格式（文件TvLDH.ali). 第一行包含序列码，形式为P1;code.用冒号分隔拥有十个域的第二行通常包含结构文件的信息，如果可用的话。只有这些区域中的两个被用于序列，sequence(表明这个文件包含一个结构未知的序列)和TvLDH（模式文件名）。该文件的其余部分包含TvLDH的序列，使用*标记它的结尾。使用标准的单字母氨基酸码。（注意必须使用大写形式；一些小写字母用于非标准残基。见Modeller中的modlib/restyp.lib文件以获取更多的信息）搜索已知结构的潜在相关序列通过MODELLER的profile.build()命令来执行。以下脚本，逐行执行以下操作(见文件build_profile.py)：为这一建模运行初始化environment，通过创建一个新environ对象。几乎所有的MODELLER脚本都需要这一步，因为新的对象（在这里我们称之为env，但你可以将它命名为任何你喜欢的）对构建大多数其他有用的对象是必须的。创建一个新的sequence_db对象，命名为sdb。sequence_db被用于容纳蛋白质序列的大型数据库。读取一个包含序列相似性在95%的非冗余PDB序列的text格式文件到sdb数据库中。这一序列在pdb_95.pir文件中，和之前创建的序列一样，这个文件也是PIR格式。写一个二进制机器特异性文件，包含上一步骤中所读的所有序列。读取二进制格式文件。注意，如果你打算使用一个数据库多次，你应该只使用前两个步骤一次，以生成二进制数据库。在随后的运行中，你可以忽略这两个步骤并且直接使用二进制文件，因为读取二进制文件比读取PIR文件快很多。产生一个新的alignment对象，命名为aln，从文件TvLDH.ali中读取我们的二进制序列TvLDH，并且将其转化到一个配置文件prf中。配置文件包含着与序列比对相似的信息，但是更加的简洁并且有利于数据库搜索。为我们的二进制配置文件prf搜索序列数据库sdb。序列数据库中所匹配的被添加到配置文件中。写一个二进制序列和它的同源物的配置文件（见文件build_profile.prf).等效信息也被以标准序列格式写出。注意，因为这个脚本是通过Python编程语言所写的，它使用Modeller-特异性命令，所以在你的命令行中应该通过使用一个和下面相似的命令来运行该脚本 mod9v1 build_profile.py 注意，mod9v1脚本运行Modeller 版本 9v1，使用不同版本的Modeller就将mod9v1改为相应的版本。 profile.build()命令拥有许多选择项。在这个例子中rr_file被设置使用BLOSUM62相似矩阵（Modeller发布中所提供的文件blosum62.sim.mat）。因此，参数matrix_offset 和 gap_penalties_1d被设置成对BLOSUM62 矩阵是适当的。例如，通过设置参数n_prof_iterations等于1我们将仅运行一个搜索重复。这样，不需要检查配置文件的偏差(check_profile set to False)。最后，参数max_aln_evalue被设置成0.01，说明e值小于或等于0.01的序列将被包含在最终的配置文件中。筛选一个模板 build_profile.py脚本的输出被写入到build_profile.log文件。MODELLER总是产生一个log文件。log文件中的错误和警告能够通过分别搜索_E and _W 附加条件而发现。MODELLER也将配置文件写入到text格式的build_profile.prf文件。输出文件的一个摘录（忽略对齐序列）接下来能被看到。前6个注释行表明MODELLER中用来构建配置文件的输入参数。后面的注释行相当于通过profile.build()所检测的相似性。 profile.build()输出中最重要的列是第二，第十，第十一以及第十二列。第二列报告了和目标序列相比较的PDB序列的代码。每一行的PDB代码是一组PDB序