网站大量收购闲置独家精品文档,联系QQ:2885784924

中国知网查重结果.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章近红外光谱分析中建模方法 多元线性回归(MLR),主成分回归(PCR)和偏最小二乘回归(PLSR)在近红外光谱数据的校准中是三个常用的多元方法。事实上,这三种方法有一个共同点就是使用线性最小二乘拟合技术。这意味着他们建立线性模型在一个独立的(光谱数据)和一个独立的(因变量)之间,然后运用最小二乘拟合结束估计回归效果。当变量数量较少时,以上几种线性方法建模效果会大大不如非线性建模方法,支持向量机(SVM)是一种核方法,以结构风险降到最小为原理的一种建模方法,在非线性回归的问题上占有独特的地位。 3.1 多元线性回归(MLR) 若自变量的数量为个,(),因变量为,在与之间,我们可以建立一个线性模型,即 (3.1) (3.2) (3.3) 在式中,是回归系数。 在式(3.1)~(3.3)中是仅有一个试样的线性模型,若有个试样,即为()它的列向量的数值是,作为回归系数与原来完全相同,矢量作为矩阵的行,则: (3.4) 在这种情况下,是试样数,是自变量数。有以下三种情况: (1),在试样数小于变量数的情况下,通过与对比,则有无穷多个解。 (2),在试样数与变量数相等的情况下,若矩阵满秩时,则矢量有唯一解。但这种极特殊情况在日常生活遇见的机会几乎为零。此时我们有: (3.5) (3),试样数大于变量数,尽管我们解不出准确解,但是使残差矢量尽最大可能小而得到解: (3.6) 这就是我们所熟知的最小二乘法。其解为: (3.7) 在上面的叙述中,因变量为1个,而事实上可以有很多个因变量。如有两个因变量和,我们可以把它们写成两个线性方程: (3.8) 若用矩阵表示,则: 由此得到 最小二乘的解为: (3.9) 当用多元线性回归时,没有一个持续的解决办法当变量比样品多时随着无穷多解存在,这最终导致系统出现弱点。另一种情况,当样品比变量多时,导致一个过渡确定的系统,这使系统没有一个准确的解决方法。因为多元线性回归有很多缺点,这就促使了主成分回归法(PCR)的出现。 3.2主成分回归(PCR) 对于多元校正可以知道的不同回归方法中,基本分析方法包括部分偏最小二乘回归,主成分回归已经在化学计量学里得到关注。为了避免共线性问题,PCR通过减少不重要的主成分而减少系统内现存的噪音从而解决这个问题。主成分回归通过准确的潜在变量可直接用于不理想的数据。主成分回归被广泛的用于对数据已在非独立的或预测变量里有大量协方差的回归模型。代替回归到原始测量变量光谱的测量系统的浓度,PCR实现了光谱数据的分解在将浓度信息回归成主成分数。通过主成分的分析表明:原变量矩阵能够表示为主成分矩阵,而由是本征矢量上投影所得。矩阵与主成分的本征矢量一一对应,即 。 设矩阵的阶为,若的阶与相等,则多元线性回归与主成分回归所得结果完全相同,这使主成分回归好的地方不能显示。主成分数一定会比小很多,去掉贡献小的变量,主要是因为这些去掉的变量大部分都是噪声,选择之后建模预测结果比较好,也比较稳定。 综上所述,可由T来表示: (3.10) 由此可得线性方程: (3.11) 其解为: (3.12) 部分偏最小二乘与主成分回归和多元线性回归有关。PCR的目的是在回归到浓度变量之前找到在数据里捕获更多的方差的因素。而多元线性回归是寻找单一的元素及换人数据与浓度有关的因素。PLS尝试最大化协方差,这样把误差和关联数据联系到一起,当PLS搜索到两个矩阵最吻合的空间因素是,它的预测远远优于PCR。 3.3 偏最小二乘方法(PLS) 3.3.1 偏最小二乘基本原理 然在PLS模型里,隐变量包含基于外部效应的变化,以同样的方式随着未知化学干扰可能包含一个定标方法的模型。在校准集中提供的干扰变化,一个校正模型可以基于在线性和未知干扰的变量情况下建模精度较好。在全校正模型里表明:光谱变量的新来源可以通过包含一个限制的额外的PLS因素的模拟。由于增加了校准模型的维度,为了参数做一个更好的估计而改变的条件下测量大量的样品是有必要的。当高非线性效果在光谱里出现时,许多额外的因素对于模拟光谱差异是有必要的,有时模拟这些光谱的差异是不可能的。 偏最小二乘回归和主成分分析很相似,相似之处在于代表变量中因子的同时也能用于代表变量。为了实现这一问题,在数学理论上我们用矩阵的列来预测矩阵中的变量,与此同时矩阵的列用来算出矩阵的因子[30]。其数学模型是: (3.13) (3.14) 此处,和的矩阵元由和计算出来的,而和的矩阵元是和的装载,和运用偏最小二乘回归模型法去修正和所造成的误差。 (主成分分析) (因子分析) (3.15) 在理想的理论情况中,中的误差和中的误差的来源基本相同,即影响和的因素相同。但实际上,中误差与中误差不一样且不相关联,因而,但当用两个矩阵同时确定因子的时候,则和的因子有以下关系形式: (3.16) 式中所

文档评论(0)

jwjp043 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档