用于稳健非线性多变量光谱校准Bagging方法.pdfVIP

  • 0
  • 0
  • 约9.07万字
  • 约 20页
  • 2026-01-29 发布于北京
  • 举报

用于稳健非线性多变量光谱校准Bagging方法.pdf

化学计量学与智能系统105(2011)1–6

目录列表可在ScienceDirect化学计量学与智能系统期刊主

页上获取:

用稳非性多变量光谱校准的Bagging方法

于健线

⁎,·劳

加南洋工大学化学与生物医学,新加坡637459,南洋路62号

新坡理

文章信息摘要

文章:收到日期:修改本文介绍了将bagging技术应用于非线性回归模型以获得更准确和稳健的光谱校准。Bagging是指通过有放回的自

后收到日期:接受日期:助采样方法获得多个模型,并将其组合成一个集成模型以减少预测误差。它特别适用于“非稳健”模型,如人工神经

发布日期:2010年11

网络(ANN)和过程回归(GPR)等非线性校准方法,这些方法中的小数据或模型参数变化可能导致模型预测

月19日

结果显著变化。还研究了一种基于无放回子采样的bagging变体,称为subagging,据其预测能力与bagging

相似但计算量较小。然而,本研究表明,subagging的校准性能对子采样数据量敏感,需要通过计算密集型交叉验

:Bootstrap聚合集证来确定。因此,我们建议在实际应用中优先选择bagging。通过对两个近红外数据集的应用研究,证明了所提出

成建模近红外光谱非线性校方法的有效性。

准稳健模型

©2010ElsevierB.V.。

1.介绍Bagging,即“自助聚合”,最初由Breiman[24,25]提出。它通

过自助重采样策略从一系列训练集中生成不同的模型。然后,这些模型

近年来,光谱技术与多变量校准模型相结合已成为制药、和食以某种方式组合起来进行预测。自助法由Efron[26,27],开发,是一种

品行业快速无损分析的重要工具。[1–4]。主成分回归(PCR)和偏最小通过从原始训练集中随机选择固定数量的数据点来形成不同训练集的技

二乘法(PLS)[5]是传统的线性校准技术。在实际应用中,外部干扰如术,且允许重复选择。许多研究已经证实了bagging在减少预测误差方

光散射效应[6],温度和变化[7–9],以及仪器背景噪声和基线漂移的面的效率。还已证明,bagging对于非稳健模型特别有效[24]。

变化[10,11]可能会导致光谱的非线性变化。在这种情况下,线性校准技

术可能会产生确的预测。为了处理非线性问题,已经提出了几种策

略,如预处理[12](正态变量变换(SNV)[13],扩展乘法信号校正

(EMSC)[14],等),非线性校准技术(人工神经网络(ANN)[15–在回归领域,bagging最初被应用于回归树[24]。随后,研究重点

17],过程回归(GPR)[18,19]),以及变量选择[20,21]。然而,这转向了bagging神经网络[31–36]。,bagging被开发用于其他回归

些模型可能不够稳健,即校准数据和/或模型参数的小变化可能导致模型方法,如偏最小二乘法(PLS)、多元线性回归(MLR)[37],和过

预测的显著变化。集成建模是一种有效的方法来提高模型的稳健性[22]。程回归(GPR)[38]。多年来,bagging已经以多种方式进行了修改,

集成建模的一般思

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档