qsarqspr模型验证方式与预测能力的关系研究 the relationship between model predictive ability and validated method in qsarqspr study.pdfVIP
- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
qsarqspr模型验证方式与预测能力的关系研究 the relationship between model predictive ability and validated method in qsarqspr study
VoL
第27卷第2期 计算机与应用化学 27,No.2
2010年2月28日 and February,2010
ComputersAppliedChemistry
QSAR/QSPR模型验证方式与预测能力的关系研究
张文军,张运陶。
(西华师范大学应用化学研究所,四川,南充,637002)
摘要:QsAR研究中,判断模型预测能力至关重要。长期以来,模型的预测能力是使用留一法或留k法等内部验证来
确定,但在2004年形成的OECD规则中,已明确规定必须使用外部验证集去评价模型的预测能力。为了研究内部验
证和外部验证与模型预测能力之间的关系,本文以45种睾酮和二氢睾酮衍生物以及37种萘锟酯衍生物为研究对
象,以E.Dragon计算的分子描述符作为自变量,在增n减l算法选择变量的基础上,采用SVM算法对同种物质的不
同活性以及不同物质的不同活性建立QSAR模型,研究QSAR/QSPR建模时的不同验证方式与模型预测能力的关
系。研究结果表明,模型的预测能力与内部验证结果的好坏无必然联系,而结合外部验证的检验结果则是判断模型
预测能力的可靠依据。
关键词:QSAR/QSPR;模型验证;预测能力
文献标识码:A 文章编号:1001-4160(2010)02-201-205
中图分类号:TQ015.9;06-39
1 引言 酮和二氢睾酮衍生物,以及37种萘锟酯衍生物的分子结构,
长期以来,在定量结构一活性(性质)关系(QSAR/
计算分子描述符,计算了睾酮和二氢睾酮衍生物119种拓扑
QSPR)研究中,研究者往往通过使用留一或留k交叉验证
指数和33种连接性指数;计算了萘锟酯衍生物96种2D自
法,仅从内部验证角度来确定模型预测能力的高低【l-9】。但
相关指数。
在2004年QSAR国际会议上正式形成的OECD(TheO玛aIli—
2.3方法
aationforEconomic and
Co--operationDevelopment)规则,已明
使用增n—l法结合pSVM算法选择变量建立模型。
确规定必须使用外部验证集来评价模型的预测能力“们。目
前国内学术刊物上关于QSAR/QSPR的研究报告中,尚少见
QSAR模型。
有明确遵循OECD规则的论文发表,为此,本文以45种睾酮
2.3.1 增n—l算法
和二氢睾酮衍生物以及37种萘锟酯衍生物作为研究对象,
增n—l是结合正向筛选和逆向剔除的1种算法。该法
分别从同系列衍生物和不同系列衍生物2个方面,研究
首先正向筛选儿个变量,然后逆向剔除1个变量;重复以上2
QSAR建模中内部验证和外部验证与模型预测能力的关系。
步,直到选择的变量个数达到预设值,输出结果。算法具体
将45种睾酮和二氢睾酮衍生物¨¨以及37种萘锟酯衍生
步骤如下:
物‘121分别按文献¨1-12]分为训练集和预测集,采用增n减l
您可能关注的文档
- nurbs插补中的速度规划与参数计算 velocity planning and parameter calculating in nurbs interpolation.pdf
- n个最频繁项集挖掘算法 mining algorithms of n-most frequent itemsets.pdf
- nvmmds——一种面向非易失存储器的元数据管理方法 nvmmds-metadata management method based on non-volatile memory.pdf
- ocpa仿生自主学习系统及在机器人姿态平衡控制上的应用 ocpa bionic autonomous learning system and its application to robot poster balance control.pdf
- oncedeep 数据交换服务器集群系统的设计与实现 design and implementation of oncedeep data exchange server cluster system.pdf
- oncermf一种效用驱动的中间件资源管理框架 oncermf a middleware resource management framework driven by utility.pdf
- openvx与三维渲染在多态gpu上的并行实现 parallel implementation of openvx and 3d rendering on polymorphic graphics processing unit.pdf
- oracle体系结构研究 talking about the architecture of oracle superficially.pdf
- otis网络的支配集问题算法研究 algorithms for dominating set problems in otis networks.pdf
- origin和matlab软件对mgcl2-h2o-c4h8o2三元体系相图的可视化应用 digital phase diagrams of ternary system mgcl2-h2o-c4h8o2 by origin and matlab.pdf
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)