- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高 婷等:最小二乘支持向量机方法用于提高低水平量子化学方法计算吸收能的精度
的原子数为8个,最大分子的原子总数达到90个,可以作为相对较大的分子的代表.图1给出了部分
较大的有机分子的结构图(所有分子结构见参考文献[5]),其中25号分子包含90个原子,芳环数为8
个;47号分子包含81个原子,杂原子数达到 11个;51号分子包含82个原子,其非氢原子数为48个.
将数据集随机分成2组,130个作为训练集,30个作为测试集.
Me
Mes=一l—S
No.21—25 2—4,6,8) No.45—47=1—3) No.50and51(n=1,2)
Fig.1 Structuresofseveralbiggermolecules
1.2 参数选择
获取分子参数是校正方法在量子化学计算中应用的前提.本文运用 B3LYP/6.31G(d)方法对所研
究的160个分子的基态进行优化,之后分别采用TDDFT/B3LYP/STO.3G和ZINDO方法获得激发态的
电子属性 .前期工作中 已筛选出8个主要的分子物理参数,分别为吸收能的理论计算值、分子
的电子数、振子强度、双键数、总的原子数、氢原子数、碳原子数和氮原子数.本文针对上述8个参数
来提高低水平量子化学方法的计算精度.
1.3 校正方法
由Vapnik 提出的支持向量机方法(Supportvectormachine,SVM)是一种有效的回归技术,具有
比人工神经网络更好的泛化能力,只需相对较少的计算资源即能消除神经网络的过拟合现象,自动获
得网络结构,因而对于此方法的研究已成为计算智能技术研究及相关领域中的热点.目前主要应用于
模式识别 ,”]、药物设计 H]、基因选择 、图像处理 及时间序列预测 ,。等领域.
Suykens等 于 1999年提出的LS—SVM方法,是对传统SVM的一种扩展.由于SVM的训练本质
上是一个凸规划或二次规划 问题,因此当样本数 目较大时,传统SVM训练速度减慢,内存需求增大.
与之相比,LS—SVM只需求解一个线性方程组,因此学习速度较快,且内存需求较小.Ls—sVM一经提
出,很快就被应用到了物理、化学、计算机、生物和工程等领域 .本文所采用的LS—SVM方法基于
Matlab/C工具箱 ,并以高斯径向基函数作为LS—SVM的核函数.
2 结果与讨论
表 1给出了160个有机分子吸收能的实验值 (理论值分别由B3LYP/STO-3G和ZINDO两种低精度
方法计算得到)以及LS.SVM校正前后的误差值,从表 1可以看出,校正前,理论计算值与实验值之间
存在较大误差,校正后多数分子的误差明显降低,个别分子的校正值和实验值基本吻合.特别是对于
图l中列出的较大分子,计算精度显著提高.
图2为 160个有机分子吸收能的实验值和根据校正前后各方法对应的吸收能计算值绘制的散点
图,图中“△”代表训练集分子,“×”代表测试集分子.图2(A)给出的是由B3LYP/STO一3G计算值和实
验值绘制的散点图,可见理论计算值明显大于实验值,且随着分子本身实验值的增大,理论值的误差
也逐渐增大.图2(B)给出的是以ZINDO计算值和实验值绘制的散点图,可见理论值的误差较大,且
大多数的理论值都小于实验值.本文采用LS.SVM校正理论计算值,经校正后,散点都落在了对角线
上,说明校正后理论值的误差明显减小.对于B3LYP/STO-3G和 ZINDO两种方法,其均方根误差分别
从0.95和0.46eV降低到0.16和0.15eV.尤其是B3LYP/STO.3G方法,校正后误差减小得更显著.
图2的插图为表示误差的柱状图,显然量子化学方法得到的计算值误差较大,LS.SVM校正后的
计算值误差明显减小.对于B3LYP/STO一3G/LS—SVM计算方法,有 150个分子的吸收能误差在一0.3~
0.3eV之间;对于ZINDO/LS—SVM计算方法,有 151个分子的吸收能误差在一0.3~0.3eV之间;校正
前,上述2种方法计算得到的误差值在该区间的分子数只有23和67个.在-0.1—0.1eV这个区间
内,B3LYP/STO:3G和ZINDO校正前的分子个数分别是3和25个,校正后分子个数分别达到了95
2736
文档评论(0)