- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最小二乘法在化学实验数据分析中应用.doc
最小二乘法在化学实验数据分析中的应用
摘要:介绍了一种线性模型参数回归分析方法—最小二乘法,并以化学实验测试数据为例,讨论了最小二乘法在化学实验数据分析中的应用。并对正交最小二乘法和经典最小二乘法的结果进行了简略比较。
化学实验中,经常需要根据实验测得一系列数据,例如,n对数据(x1, y1) (i=1, 2, … , n),去寻找自变量x和因变量y之间的关系,此关系应该最能反映出给定数据的一般趋势。这就是用某种曲线拟合的方法来回答这个问题一这些变量之间的最佳关系是什么。如果从图形上看,这个问题就是按给定理平面上n个点(x1,y1)
经典的最小二乘法(classical least square, CLS)在化学领域的数据处理中获得广泛应用。值得指出的是,此方法的应用有一重要前提,即假设自变量的值是完全准确的,或其测量误差与因变量的测量误差相比可以忽略不计。例如,以分析化学中的标准曲线为例,自变量元素浓度与因变量物理测量值相比,其测量误差可以忽略不计。然而在许多情况下,这一假定往往难以满足。如果某一实验数据中自变量和因变量同时存在测量误差,此时经典的最小二乘法难以满足数据处理的需要。
正交最小二乘法(orthogonal least squares,OLS)也是一种线性模型参数回归分析方法。当
自变量和因变量同时存在均值为零,相同方差的随机误差时,此方法能给出在统计意义上最好的参数拟合结果。正交最小二乘法在许多科学领域,如医学、地质学、工程数学、信号处理等均获得应用。有关此方法的研究和应用是当前国际数理统计学领域的一个前沿课题。
本文以实验教学实例,谈用最小二乘法在化学实验中的应用。对正交最小二乘法和经典最小二乘法结果进行了详细比较。对描述正交最小二乘法线性回归分析质量的指标— 线性模型能解释的方差(VEM)与经典最小二乘法的线性相关系数的关系也进行了讨论。
1最小二乘法及正交最小二乘法的原理及算法
为说明正交最小二乘法的原理,可考虑一个简单例子。假设在一线性模型中仅有一个参数待定:
(1)
其中x是自变量,y是因变量,a是待拟合的回归系数,x、yn次测量值。
(2)
(3)
、是变量x,y的真实值,、(i为1,2,…,n)代表随机误差。
如果x能准确测量,即=0,测量误差仅存在于变量中,因此用经典的最小二乘法求方程(1)中的参数毫无问题。其原理可表示为,使测量值与计算值之差的平方之和,即最小。图1是此方法的几何解释。
如果y能准确测量,即=0,测量误差仅存在于变量中,用经典的最小二乘法也能求得其参数,(1)式可改写为:
(4)
通过使x变量的测量值与计算值之差的平方和,即最小,即可获得最好的参数估计值(参见图1 )
图1 一元线性模型最小二乘法的几何解释
(a)=0(CLS Solution); (b) =0(CLS Solution)
(2) ≠0, ≠0(OLS Solution)
然而在许多待处理的数据中,自变量和因变量同时存在测量误差,即≠0, ≠0,如果此误差相互独立,且具有均值为0,相同方差的误差分布,在统计意义上最好的参数估计值a可通过使各实验点到拟合直线的垂直距离的平方之和,即最小来求得。这是正交最小二乘法中待拟合参数个数为1的一种特殊情况。图1也清楚地显示了其原理。此方法也称为正交回归(orthogonal regression),全最小二乘法(total least squares, TLS),或变量中同时存在误差的回归分析法(errors-in-variables regression)。
再考察多元体系。已知多元线性模型中有m个参数待定,有n次测量值:( nm),,正交最小二乘法的解法可归纳为:
这里表示矩阵Fcoberius模。一旦求得矩阵最小的解,满足的参数(i为1,2,…m)(SVD),则:
利用MATLAB高级计算语言,能方便地求出正交最小二乘法的解:
Load filename.dat (此处filename.dat为ascii格式);
[u,s,v]=SVD(filename);
a =-1*v(1:m,m+1)/v(m+1,m+1); (此处filename=[X,y])
计算主成分分析(principal component analysis, PCA)的NIPALS算法,也可用于计算正交最小二乘法的解。在PCA程序的基础上,仅需在适当地方加上几
文档评论(0)