互信息诱导子空间集成偏最小二乘在近红外光谱定量校正中的应用 Ensemble Partial Least Squares Algorithm in Mutual Information-Induced Subspace for Near-infrared Quantitative Calibration.pdfVIP

互信息诱导子空间集成偏最小二乘在近红外光谱定量校正中的应用 Ensemble Partial Least Squares Algorithm in Mutual Information-Induced Subspace for Near-infrared Quantitative Calibration.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第37卷 分析化学(FENXIHUAXUE)研究简报 第12期 Chinese of 1834—1838 2009年12月 Jourmd AnalyticalChemistry 互信息诱导子空间集成偏最小二乘在 近红外光谱定量校正中的应用 谭超“’2 覃鑫1 李梦龙3 1(宜宾学院化学与化工系,宜宾644007)2(宜宾学院计算物理重点实验室,宜宾644007) 3(四川大学化学学院,成都610064) 摘要在集成框架下,提出了一种联合自助采样和基于互信息变量选择的子空间回归集成偏最小二乘算 法MISEPLS。此算法的核心是通过训练集自助采样和随后计算互信息的方式来引入成员模型的差异性。由 于互信息量小于一个特定阈值的变量被淘汰,每个成员模型在原始变量的一个子空阃得到训练。模型融合考 虑了简单平均和加权平均两种方式。通过两个近红外光谱定量校正实验,与建立单模型的全谱偏最dxZ.乘算 法(PtS)和基于互信息变量选择的偏最小二乘算法(MIPL$)进行了比较。结果表明,在不增加模型复杂度的 情况下,MISEPLS能建立起更精确、更稳健的校正模型。 关键词互信息,子空间,集成,校正,近红外光谱 1 引 言 近年来,近红外光谱(NIR)技术以其简便、快捷、低成本、无污染以及不破坏样品等优点,被越来越 多地应用于石油、化工、医药、食品等领域【l“j。近红外光谱对应分子中含氢基团的振动倍频与合频,加 之各种干扰存在和物理因素影响,具有背景复杂、谱峰重叠、变动、信号弱的特点,其中的有效信息率非 常低。因此,从复杂、重叠、变动的光谱信号中提取微弱的有用信息,并建立校正模型是应用近红外光谱 技术的难点和关键,直接决定了其可用性[5]。化学计量学算法已成为近红外光谱技术的核心技术之 (SVM)‘101等。 传统的校正技术一般基于建立单一模型,在很多情况下,特别是当训练集较小时,单一模型的预测 Orconsensus)策略为解决该 能力与稳健性难于达到要求【11|。起源于机器学习的集成或共识(Ensemble 类任务提供了新思路¨2】。所谓集成就是利用多个模型来解决同一个问题。对于模型设计者,不必试图 采用复杂算法建立单个复杂模型,而是利用多个简单模型某种互补,可达到同样的目标。通常,在集成 框架下,需要通过某种扰动(如对样本或变量重采样)产生分散的训练子集,并建立相应的成员模型,再 通过简单平均或加权平均等方式将多个成员模型整个合起来,最终产生一个所谓的集成模型。集成最 早应用于模式识别,由于其呈现出的众多优势,在化学计量学领域也已受到广泛关注。文献中报道了一 KPLS[1 PLS¨钊等。与 3l,Boosting4|,SubaggingPLS¨5|,Consensus 些有效的集成算法,如Bagging.PLS【1 单模型算法相比,集成类算法能更充分地利用训练样本信息,因而能产生更精确和更稳健的校正模型。 在集成框架下,本研究提出了一种联合自助采样和基于互信息变量选择的子空间回归集成算法 MISEPLS。其主要特点是综合训练集自助采样(Bootstrap)ElT]和互信息(Mutual 来引入成员模型的差异性。由于互信息量小于一个特定阈值的变量被淘汰,每个成员模型在原变量集 的一个子空间训练,因此可避免多元共线性带来的诸多问题。同时,也比较了简单平均和加权平均两种 模型整合(融合)方式。通过两个近红外光谱定量分析实例及与建立单模型的全谱偏最小二乘算法 模型复杂度的前提下,显著提升校正模型的预测精度和稳健性。 2009-06-25收稿;2009-07-31接受 本文系四川省青年科技基金(No.09zQ026啪6)和宜宾学院博士科研启动基金(No.2008806)资助项

您可能关注的文档

文档评论(0)

000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档