- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
04-第二章线性代数模型的回归分析方法
线性代数模型的回归分析方法
2.1 概 述
对于许多具体问题,由于对过程的本质缺乏了解,或者由于过程本身太复杂,不可能准确地用机理模型描述该过程。为了建立这类过程的观测变量和自变量之间依存关系的数学表达式,常常可用多项式这一类函数去拟合实验数据,例如:
由于这类模型的建立纯粹是根据实验值和曲线(即模型计算值)拟合的好坏为评判准则的,所以常称为经验模型。这类模型的函数形式有一定的任意性,模型的参数b0、b1、b2 、b3……等纯粹是数学上的常数,并没有任何物理意义,一般也不用因次表示。此外,这类模型的应用仅限于实验数据覆盖的范围内,不能利用模型方程把结果外推到实验数据范围之外。所以,经验模型的应用常常是有局限性的。
由于这类经验模型大多数是线性代数模型,或可化为线性代数模型。因此,模型参数值的估计和模型检验常常采用回归分析方法。所谓回归分析方法,就是利用统计方法,从大量实验数据中寻找观察变量与自变量之间的统计规律性。这类统计规律称为回归关系,有关回归关系的计算方法和理论统称回归分析。回归分析的研究内容是多方面的,本章主要讨论下述内容:
对一组给定的实验数据,根据经验给出一个线性代数模型,确定变量与自变量之间的定量关系,即确定待定参数值;
对所建立方程的可信度进行统计检验;
从影响某一观测变量的许多自变量中,判断哪些变量对观察变量的影响是显著的,哪些是不显著的;
介绍一种建立“最优”回归方程的方法——逐步回归方法;
利用所得的回归模型进行预测和控制;
用回归分析方法建立数学模型的基本思想,是把一个过程看作一个“黑箱”。所谓“黑箱”就是该过程的输入和输出都是已知的,但它的内部机理不清楚。“黑箱”的输入就是一些自变量的因子x1、x2、x3、((((((xp,输出就是观察变量y。上述描述可用图2-1(右图)表示。虽然不能确切知道过程内部机理,但观察变量总可以表示为因子x1、x2、x3、((((((xp的一个函数,即:
y=f(x1、x2、x3、((((((xp)
这里的自变量(又称独立变量)是指在实验手段控制下的那些变量,所谓独立是直在实验中可以独立调节和控制,而不是指函数关系间的独立概念。回归分析所研究的数学模型主要是线性代数模型,这里“线性”是指模型方程对待定参数是线性的,而对自变量本身却可以是非线性的。而模型主要有以下几种情况:
模型对参数b是线性的,对自变量x 是非线性的,如:
模型对自变量x是线性的,对参数b是非线性的,如:
模型对自变量x和参数b都是非线性的,如:
在本章中讨论的线性模型均是指对参数是线性的,对线性模型的通式可写为:
y=b0f0(x1、x2、x3、((((((xp)+ b1f1(x1、x2、x3、((((((xp)+ ((((((+ bpfp(x1、x2、x3、((((((xp) (2-1)
上式是自变量,即实验条件是一些已知量。函数fi的具体形式也是已知量,所以fi(x1、x2、x3、((((((xp)可根据实验点计算求得。由于观察变量y对参数是线性的,所以观测变量y对各个参数bi的一阶偏导数不再是参数的函数,这就是线性代数模型的一个特点,在后面参数估计中充分利用了这个特点。
在具体处理线性代数模型时,总是把上述模型通式化简写作:
y=b0+b1x1+ b2x2+((((((bpxp (2-2)
式中,y是观察变量(或称为因变量或响应量),x是自变量(或称为独立变量),b是待定的回归系数(模型参数)。
利用经验模型描述一个具体过程有一定的任意性。主要是表现在函数选择上的任意性。在最简单的一类情况中,例如通过实验测定某物质的摩尔热容CP(KJ/mol(K)与温度T(K)之间的关系。在所要求的温度范围内,测定不同温度T1、T2、T3、(((((( TM下的CP值CP1、、、((((((
y=b0+b1T+ b2T2+ b3T3+(((((( (2-3)
函数(2-3)并不能反映CP(KJ/mol(K)与温度T(K)之间的本质关系,上述多项式函数形式仅是近似地逼近CP~T之间固有的反映其本质机理的函数。这种函数近似逼近真实的函数形式并不是唯一的。多项式仅仅是一种拟合性能较好的函数形式,从数学上可以知道,如果有M个实验点,在理论上必定可以用一个高于M-1阶的多项式去拟合实验数据,并使所有的实验点都准确无误地落在该多项式的曲线上,如图2-2所示。它表示了一个6阶多项式通过6个实验点的图象。经验告诉我们,由于实验测定存在误差,这样的曲线并不合理,曲线应该平滑地在实验点之间穿过。在无特殊的理论依据时,相邻的二个实验点之间不应该出现剧烈的振荡。所以,经常采用的方法是选择较低的多项式函数来拟合实验数据。
文档评论(0)