QSAR的研究中提高模型预测能力的新方法探讨及在药物化学中的应用.pdfVIP

下载本文档

10
0
约41.01万字
约 254页
2015-10-23 发布于安徽
举报
版权申诉

QSAR的研究中提高模型预测能力的新方法探讨及在药物化学中的应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要摘要科学的发展是服务于现实生活的。人们经常会以“到底有什么实际用途”、“与现实生活有什么关系”或者“能否解决实际问题”来衡量～个新鲜事物。定量结构活性关系 (Quantitative Structure—Activity 的实用性一直备受关注。QSAR发展至今，应用已经非常广泛，其研究对象包括化合物的生物活性、毒性、药代动力学参数和生物利用度以及分子的各种理化性质和环境行为等，研究领域涉及生物、药学、化学以及环境科学等诸多学科。人们期望通过各种QSAR模型从分子水平上理解化合物的微观结构与其宏观活性之间的关系，为设计、筛选或预测具有人们期望的性质的化合物提供信息。在众多的应用中，利用模型预测未经实验测定甚至未合成的新化合物的相关活性，是 QSAR模型最重要的用途之一。但是要用于预测新化合物，QSAR模型必须具有较高且可信的外部预测能力。因此本论文从建立QSAR模型的各个步骤考虑，试图解决目前QSAR研究中某些还有待完善的问题，重点研究了定量构效关系研究中化合物低能构象的选择问题、提出了几种新的建模策略、引入新的建模方法，旨在尽可能地提高QSAR模型的可靠性以及外部预测能力。同时，将具有很好预测能力的定量构效关系模型用于活性化合物的设计和筛选。 l!Ij发展历史、研究现状到论文第一章对定量结构活性关系研究进行了概述。从QSAR 发展趋势，从模型的建立、检验到应用，都进行了详细的阐述，并重点讨论了模型的验证问题。另外为了对QSAR建模方法有清晰的认识，本章从不同角度对各种QSAR方法进行了分类归纳；论文第二章讨论了二维QSAR研究中的一个基本问题——化合物构象对于定量构效关系模型的影响。旨在分析不同能量优化方法所得到的低能构象的差别、对最终QSAR模型的影响有多大。基于什么样的构象对于建立最终模型的至关重要，这也是一个QSAR研究的基础。通过对三组复杂程度不同的化合物进行研究后，得出了以下主要结论： (1)进行分子的三维结构优化时所用的初始构象能够影响模型的最终结果，并且分子结构越复杂影响越大； (2)构象搜索能够给出能量较低的分子状态，它可以协助分子力学或半经验等优化方法很快很容易的找到全局最优的低能构象； (3)如果所建立的QSAR模型用于新化合物的预测，则新化合物最好与训练集数据使用同样的优化方法；第三章介绍本文提出的两种新颖的一致性建模分析方法：WCM和改进的CDFS。一致 T ，～．．．． … ．～一兰州大学．李加忠博士论文．．．，性建模分析是一种新型的建模方法，但目前用来建立一致性模型的方法都是平均策略 (ACM)。实际上不同的子模型包含的信息不同，对于最终活性的贡献也不同。因此本文提出一种更加合理的加权策略(WCM)，考虑用多元线性回归的方法给子模型不同的权重，并且提出了Q2引导的子模型选择策略(QGMS)来指导子模型的选择过程。这两种策略用于一系列丙二酰辅酶A脱羧酶抑制荆的定量构效关系研究，WCM模型的表现优于ACM和最佳单个模型，模型的拟合能力和预测能力都有很大提高，且模型更加稳定可靠，可解释性增强。 CDFS是另一种一致性建模思路。CDFS方法将数据集进行多次分组分别建模，然后取模型的公共描述符建立最终模型。该方法的缺点是很难保证所得到的若干训练集的代表性。本文提出利用科学的分组方法得到具有代表性的训练数据，基于该数据利用不同的描述符组合进行建模，描述符出现频率越高说明其包含的结构信息越重要，然后取出现频率高的描述符建立最终模型。该方法用于169个噻唑类淋巴细胞特异性激酶抑制剂的定量构效关系研究，最终得到了包含八个公共描述符的模型，得到了很好的结果；第四章指出了局部建模local lazy 的解决办法。在局部建模分析中，如何确定最优的临近点数量(k)对模型的预测是至关重只是一种内部检验技术，不能说明模型的外部预测能力，因此建立模型进行预测的可靠性值得怀疑。本文提出通过监测局部模型的外部预测能力来提高LLR预测的可靠性和准