- 4
- 0
- 约2.86千字
- 约 21页
- 2017-02-05 发布于天津
- 举报
应用R进行QSAR的尝试-统计之都
应用R进行QSAR的尝试 ---以PAHs在根际消解效果的QSAR分析为例 关于QSAR的背景 定量构效关系(Quantitative Structure-Activity Relationship,简称QSAR)是指利用理论计算和统计分析工具来研究系列化合物结构与其效应之间的定量关系,即借助结构参数构建数学模型来描述化合物结构与活性之间的关系。 环境科学中进行QSAR的目的 由于测定化合物的各种毒性需要花费大量的人力、物力和财力,人们不可能对众多化学品进行逐一测定 而利用QSAR 模型即可对化学品的生物毒性和环境行为进行预测,并筛选出具有潜在危害的化学品,这在环境科学研究中无疑是一件极具意义的工作 R与QSAR 统计分析工具 QSAR中需要的数学方法 R中的各种包提供几乎所有QSAR研究需要的数学方法 如果将这些方法集合为一个QSAR专用的包,无论对R的发展还是QSAR的应用都是有利的 QSAR过程与R R中包含QSAR数学方法的包 R是QSAR的有力工具,但是…… 应用R进行QSAR的一个尝试 以R进行多环芳烃(PAHs)在植物根际消解效果的QSAR分析为例子来说明R再QSAR中的应用。 为什么研究多环芳烃(PAHs) 数据库的建立 活性参数是PAHs在植物根际消解效果,采用meta-analysis中常用的效应值(effect sizes, d)表示。d=ln(E/C) 分子结构参数通过Dragon 5(Talanet)计算得到965个结构参数,包括拓扑参数和理化参数。 参数的筛选 用主观选择对结构参数进行筛选,去掉所有值为恒量的参数,然后计算余下参数的相关系数矩阵,去掉相关系数大于等于0.95的两个参数中的一个。 采用R极大提高筛选效率 R中结构参数的主观筛选(去除恒量) mol.structure-read.csv(mol_indeces.csv, +sep=,,header=TRUE, dec=.) dim.mol-dim(mol.structure) a-dim.mol[1] n-0 for(k in 1:(dim.mol[2]-n)) {if (mol.structure[1,k]==mol.structure[a,k]) + { mol.structure-mol.structure[,-k]; +n-n+1; +k-k-1}} write.table(mol.structure, file=molstruc1.csv, sep=,) R中结构参数的主观筛选(去除高相关性参数) cor.matrix-cor(mol.structure) dim.cor-dim(cor.matrix) m-0 for(i in 1:(dim.cor[1]-1)){ for(j in (i+1):(dim.cor[2])){ if (cor.matrix[i,j]=0.95){ +mol.structure-mol.structure[,-i]; +i-i+1} }} dim(mol.structure) write.table(cor.matrix,file=matrix.csv, sep=,) write.table(mol.structure,file=molstruc2.csv, sep=,) PLS构建模型 # modeling QSAR by PLS library(pls) lnR-read.table(lnR.csv,header=TRUE, sep=,) data-cbind(lnR,mol.structure) QSAR-plsr(lnR~MLOGP2+MSD+Se+ZM1+X0Χv+ +X6ΧCH+Eig1Z.1+TI2+MWC08+piPC08 ++GGI2+AEig1Z+VRD2+IDDM+HDcpx+IC0+CIC0+ +BIC0+TIC1+SIC1+BIC1+CIC2,data=data, +method=simpls,model=TRUE) 模型验证 #cross-validation the QSAR model crossval-crossval(QSAR, segments = 40, + segment.type = c(random)) RMSEP-RMSEP(QSAR) R2-R2(QSAR) plot(crossval) plot(RMSEP) plot(R2) plot(QSAR, ncomp=15) RMSE和R2 优化预测模型 用于预测和预报 #predict unstudied compound perylene-read.table(‘perylene.csv’, header=TRUE, sep=’,’) new.mol-predic
您可能关注的文档
- 基础比率分析基础比率分析–测验甲部份选择题(@1,总分10分.doc
- 基础地球科学课程纲要.doc
- 在Windows中添加常用输入法-青岛市实验小学.doc
- 基金会内部管理制度-中国少年儿童文化艺术基金会.doc
- 复旦大学附属中山医院心内科是国家重点学科-心血管疾病介入诊疗.doc
- 地勤业经营与管理.ppt
- 基础工作纸.doc
- 多元评量在九年一贯课程教学上应用之研究.doc
- 多复变简介-国家自然科学基金委.ppt
- 大东艺术图书馆.doc
- 2026版高考物理步步高大二轮 (培优版)小综合抢分练(四)含答案.docx
- 2026版高考物理步步高大二轮 (培优版)选择题满分练(二)含答案.docx
- 2026版高考物理步步高大二轮 (培优版)小综合抢分练(一)含答案.docx
- 2026版高考物理步步高大二轮 (培优版)选择题满分练(七)含答案.docx
- 电梯应急处理考核练习.docx
- 2026版高考物理步步高大二轮 (培优版)专题三 计算题培优练5 带电粒子在立体空间中的运动含答案.docx
- 2026年有限空间作业安全考试卷.docx
- 2026版高考物理步步高大二轮 (培优版)专题四 第9讲 电磁感应含答案.docx
- 物流设备维护协议.docx
- 咯血的教学课件.ppt
最近下载
- 2025年度民主生活会个人对照检查发言材料 八篇.docx VIP
- 珠海市墨库新材料有限公司年产2000吨喷墨墨水原料项目 环境影响报告表(污染影响类)珠 .pdf VIP
- 运算律复习课.ppt VIP
- 《高等教育学》知识点梳理(附答案) .pdf VIP
- 医院围手术期护理质量检查标准评分表.doc VIP
- 浙江杭州市临安区中医院招聘笔试备考题库及答案解析.docx VIP
- 乡卫生院绩效工资考核与分配方案.docx VIP
- 部编人教版道德与法治七年级下册知识梳理总结(重点版).doc VIP
- 2025年福州市长乐市辅警招聘考试真题附答案解析.docx VIP
- 【研报】2023中国游戏出海支付研究报告.docx VIP
原创力文档

文档评论(0)