《精品》偏最小二乘方法.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.未知样本预测 数学模型的求取,目的是用于未知样本的预测。其步骤为: (1) 如校正部分,将X及Y标准化(此时试样数为n1,而不是n)。 (2) h = 0, Y = (均值) (3) h = h + 1 最新. * (4) h α(主成分数)到步(5),否则到步(3)。 (5) 得到的Y为已经标准化,因此需按照标准化步骤的相反操作,将之恢复到原始坐标。 4.关于主成分数 若X和Y间关系符合线性模型,则描述模型的主成分数应与模型的维数相等。主成分数是偏最小二乘模型的重要性质。 由于测试数据一般隐含噪声,故主成分数通常与X的秩不相等。如前已述及,在实际问题的处理中,总是要消去一些因子(成分), 因为这些因子所表征的主要是测试误差、噪声及由于变量间相关所引起的共线问题等。 最新. * 确定主成分数的一种方法是以式(6.8)中Fh的模数为判据。图6.3为模数 对主成分数所得关系曲线,可以选定某值作为门限,当 小于此值时,则停止迭代。 图6.3 与偏最小二乘中因子书的关系 另一种方法是运用F 检验来测试内在相关性(inner relation)以确证所建立的模型。 最新. * 再一种方法为交叉验证法。在这种方法中计算一统计量PRESS(prediction residual sum of squares),即预测残差之平方和。如图6.4所示,显然,人们总是希望采用某一主成分数时所产生的PRESS为最小。但最小的位置常难以准确确定。用这种方法确定主成数非常类似于测定下限的概念。所谓测定下限即在噪声存在下最小可以检出的信号。在图6.4的情况下,因子数可取4—8。 图6.4 PRESS与因子数的关系 最新. * 5. 应用实例—腐植酸和木质磺酸盐的荧光分光光度分析[5] 磺酸木质素(ligninsulfonate)是水中的一种污染物,可用荧光分光光度法测定.尽管此种方法具有高灵敏度和高选择性,但在磺酸木质素的测试中腐植酸和去污剂中的光白剂(optical whitener)对其严重干扰。这三种化合物的发射光谱重叠非常严重(见图6.5).由图可见,没有一个区域仅为一种化合物所具有的发射光谱. 图6.5 腐植酸(– — –),磺酸木质素(- - - -)和去污剂(——)的发射光谱(均由纯物质测试所得) 最新. * 这三种化合物不仅发射光谱严重重叠,同时在溶液中相互间有影响,如图6.6所示,三种纯物质的发射光谱加和(—)与其混合溶液的发射光谱(––––)并不一样,这就进一步增加了问题的复杂性.但是借助于偏最小二乘法,可以进行单一成分的测试,所得结果尚较满意. 图6.6 腐植酸,磺酸木质素和去污剂纯溶液发射光谱加 和(——)及三物质混合溶液的发射光谱(- - - -) 最新. * 首先,看一下二组分的情况,表6.1所示为腐植酸和磺酸木质素混合样品的浓度测定结果。 表6.1 腐植酸与磺酸木质素混合物溶液测试结果(μg/ml) 其中,预测误差为预测浓度与实际浓度之差.如对于小组分磺酸木质素,平均误差为-0.024(μg/ml),相应的标准偏差为0.085(μg/ml)。标准偏差所用公式为: 最新. * 而非相似度因子(dissimilarity factor)的表达式为: 式中, sa2( Ex ) 为X阵的主成分模型所引进的残余标准方差。而s2为 s2= /(m – a) 其中,m为X 的维,a为主成分数,e为: 运用F显著性检验,其自由度为( m - a )/2 和( m - a )( n – a – 1 )/2 ,显著性水平为α,若s2 sa2 ( Ex )F ,则计算值可信。 最新. * * 第六章 偏最小二乘方法 偏最小二乘方法(PLS-Partial Least Squares))是近年来发展起来的一种新的多元统计分析法, 现已成功地应用于分析化学, 如紫外光谱、气相色谱和电分析化学等等。该种方法,在化合物结构-活性/性质相关性研究中是一种非常有用的手段。如美国Tripos公司用于化合物三维构效关系研究的CoMFA (Comparative Molecular Field Analysis)方法, 其中,数据统计处理部分主要是PLS。在PLS方法中用的是替潜变量,其数学基础是主成分分析。替潜变量的个数一般少于原自变量的个数,所以PLS特别适用于自变量的个数多于试样个数的情况。在此种情况下,亦可运用主成分回归方法,但不能够运用一般的多元回归分析,因为一般多元回归分析要求试样的个数必须多于自变量的个数。 最新. * § 6.1 多元线性回归(MLR) 若自变量为m

文档评论(0)

liuxiaoyu98 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档