第05讲-基于结构的药物设计解析：.pptVIP

下载本文档

54
0
约1.55万字
约 72页
2017-08-25 发布于湖北
举报
版权申诉

第05讲-基于结构的药物设计解析：.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

* * * * * * * * * * * * * * * * * * * * * * * * 交互检验 Leave-one-out (LOO) Leave-many (group) –out (LMO) Bootstrapping Out-of-train (OOT) Stochastic Model Validation (SMV) * 交互检验：依次从N个样本中抽出1个样本，用剩下的N-1个样本来建立构效关系模型，然后用建立的模型预测抽取出来的1个样本的活性，重复这个操作，直到所有样本都被抽去和预测。然后，计算预测误差的平方和PRESS和交互检验相关系数rcv 。最常用交互检验方法：留一法（leave-one-out）典型的LMO交互检验根据数据量的大小，把数据集分成2 到10 个组（G=2-10），每一组包含化合物数目基本相同（mj=n/G，相差最大为1），每次抽取一组mj 作为临时的测试集，用剩下的n-mj 个化合物建立模型对测试集进行预测。 Leave-many (group) –out (LMO) 对于大型数据，只要保证剩余的临时训练集能够得到有意义的模型，每次抽取的化合物可以任意多；但对于中小型数据（比如n50），如果每次抽取太多的化合物出来，剩余化合物就很难包含所有的重要结构信息从而得不到好的QSAR 模型。有文献已经证明对于只包含20 到30 个化合物的小数据集，每次抽出30％左右的化合物是比较理想的数字。对于含有N个化合物的训练集来说，随机抽取若干（j）化合物作为测试集，然后Bootstrapping 从N-j 个化合物中随机选择j 个化合物填充到训练集中，使训练集化合物数目保持在N个，这样，有些化合物就会在训练集中出现两次甚至多次（=2）。此时用重组后的训练集建立模型预测 j 个化合物的生物活性，计算j 个化合物的预测残差的平方和（PRESS）。此过程重复若干次，可以得到上千个PRESS值，最后将PRESS值求和，取平均值进行计算： Bootstrapping 该方法和Bootstrapping的区别在于，在抽取j个化合物作为训练集后，OOT并不会随机在N-j个化合物中选择一些化合物进行重复以保证训练集化合物数目保持不变，只是用N-j个化合物直接建立QSAR模型并进行活性预测。 Out-of-train (OOT) 随机模型检验（Stochastic Model Validation，SMV）是另一个新的检验技术，可以用来估测所有数据对于模型建模能力和交互预测能力的影响。这种技术也是要产生许多临时的训练集和测试集（Nv＝1 or many），但其旨在穷举化合物作为临时训练集（N-Nv）和临时测试集（Nv）所有可能的组合，即SMV 会给出N!/(N-Nv)!种可能的组合，也就会建立这么多的模型。很容易可以想象，这种方法实际上是LOO 和LMO 的结合。 Stochastic Model Validation (SMV) 该方法将响应值如生物活性随机打乱顺序，而保持描述符的顺序不变，从而建立新的QSAR模型。该过程重复若干次后，与原来模型的统计信息进行比较，希望所得到的平均R2和Q2等比较低，如果R20.50，那么这个模型有可能就有随机相关的嫌疑，该QSAR 模型的可靠性是值得怀疑的。是检验模型是否存在偶然相关的有力工具。 Y随机检验 * 外部检验测试集（test set）的预测：从研究的化合物中挑选出足够多的样本组成预测集，预测集中的样本不参加模型的构建，然后通过模型对预测集中的分子的预测结果来检验模型真实的预测能力。 * * 2002年在葡萄牙的 Setubal召开的一次国际会议上，与会的科学工作者们提出了关于QSAR模型有效性的几条规则，被称为“Setubal Principles”；这些规则在2004年11月得到了进一步详细的修正，并被正式命名为“OECD Principles”。规定，一个QSAR模型要达到调控 (regulatory purpose)目的，必须满足以下5个条件： 1) a defined endpoint； 2) an unambiguous algorithm； 3) a defined domain of applicability； 4) appropriate measures of goodness-of–fit, robustness and predictivity； 5) a mechanistic interpretation, if possible。实际上这五个条件就已经全面概括了QSAR研究工作的基本步骤。 QSAR