- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第34卷 分析化学 (FENXIHUAXUE) 研究报告 第3期
2006年3月 ChineseJournalofAnalyticalChemistry 316~320
基于旋转曲面变换PSO算法的
神经网络用于胺类有机物毒性分类
熊 勇”,2 陈德钊’胡上序’
(‘浙江大学化工系杭州310027 2(武汉大学自动化系,武汉430072
摘 要 神经网络模型能有效地模拟非线性的输人输出关系。本研究应用三层前馈网络对51种胺类有机物
进行了结构一毒性关系的分类研究。常w勺神经网络权值训练算法,例如误差反传算法,存在着收敛速度慢,
容易陷人局部极值点等问题。因此提出旋转曲面变换粒子群优化算法,将被优化函数的局部极小点变换为全
局最大点,同时不改变比局部极小点的值更小的区域的函数形状。此方法和粒子群优化相结合,能使待优化
函数跳出局部极值点,提高训练神经网络权值的效率。实验结果显示,基于旋转曲面变换粒子群优化算法的神
经网络,权值训练过程收敛速度较快,且自检误差和预报误差都较小,是一种有效的胺类有机物毒性分类方法。
关锐词 神经网络,定量构效关系,粒子群,旋转曲面变换
1 引 言
定量结构一活性关系(quantitativestructure-activityrelationship,QSAR)分析是研究化合物的分子结
构、理化性质同其生物活性之间关系的一种方法川。它把二者看成是一种函数关系,通过数学方法对
其建模,然后利用已有的数据对模型参数进行估计,最后用模型对新样本的生物活性进行预测和分析。
它可以用来探讨化合物的活性机理,指导新的化合物的合成和设计,是一种有广泛应用前景的方法。
QSAR建模常用的方法主要有统计方法和神经网络方法两大类。前者主要有多重线性回归以及多元数
据分析方法,统计方法要求样本数量足够多,并且要求非共线性[[21,这些要求使得它的应用范围受到一
定的限制[[3]。因为用于QSAR分析的数据之间的关系通常是机理并不很清楚的“黑箱”关系,因此比较
适合用神经网络方法来建模[’]。当设计合适的隐层单元后,前馈神经网络可以拟合任意的非线性函
数,因此是一种合适的建模方法,但它需要预先训练权重。通常的BP算法是一种基于梯度的确定性方
法,如果初始值选择不恰当,很容易陷人到局部极值点中,而且对高维输人的收敛速度很慢[[510
为了克服以上缺点,提出了旋转曲面变换粒子群优化算法[[6],它结合了粒子群全局寻优和函数变
换跳出局部极值的优点,使得全局寻优的效率提高。本研究拟用该方法训练前馈神经网络的权值,从而
为胺类有机物建立良好的QSAR模型,并将其用于毒性分类问题。胺类有机物的毒性与其分子结构有
紧密关系,本研究选取6个参数来反映分子结构,即:2个分子连接性指数(零阶的。戈和一阶的’戈),3
个信息理论指数(基团信息量RIC、基团结构信息量RSIC和基团剩余信息量RCIC)以及分子量(M),毒
性指标选用大鼠经口LD50参数。这类化合物的QSAR关系即是以上6个参数与LD,之间的关系。为找
出这种关系,选用具有代表性的51个胺类有机物做样本,它们的参数值取自文献 3【](见表1),将其分
为4类,分属低毒类(10个)、中高毒类(11个)和中低毒类(13个)、高毒类(17个)。这些样本不遵从
正态分布,且构效关系为非线性,难以用经典统计方法建立分类判别模型。
I!7前馈神经网络
2.1 网络结构
因为有6个理化参数和一个代表毒性大小的LD、值,所以前馈网络的结构设计为6-6-1,即6个输
人端,6个隐层节点,1个输出节点。6个输人端分别对应6个参数,一个输出端对应LD50值,因此共有
49个权值。根据经验规则,当网络中的权重总数小于等于样本容量时,所得模型比较稳定,所以在本实
2005-01-23收稿;2005-03-20接受
本文系国家自然科学基金资助项目(No
第3期 熊 勇等:基于旋转曲面变换PSo算法的神经网络用于胺类有机物毒性分类 317
验中隐层结点数为6是比较合适的。
表151种胺类化合物结构参
文档评论(0)