- 1、本文档共210页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2011-第1章-Origin软件全面介绍3-数据处理
Origin软件介绍 Origin软件介绍 第一篇 数据管理 第二篇 科技作图 第三篇 数据分析 第7章 曲线拟合 7.1 回归分析概述 7.1.1 什么是回归分析 所谓回归(regression)分析,简单地说,就是一种处理变量与变量之间相互关系的数理统计方法。用这种数学方法可以从大量观测的散点数据中寻找到能反映事物内部的一些统计规律,并可以按数学模型形式表达出来,故称它为回归方程(回归模型)。 7.1 回归分析概述 7.1.1 什么是回归分析 回归分析法所包括的内容或可以解决的问题,概括起来有如下4个方面:①根据一组实测数据,按算法原理建立方程,解方程得到变量之间的数学关系式,即回归方程式。②判明所得到的回归方程式的有效性。回归方程式是通过数理统计方法得到的,是一种近似结果,必须对它的有效性作出定量检验。 7.1 回归分析概述 7.1.1 什么是回归分析 ③根据一个或几个变量的取值,预测或控制另一个变量的取值,并确定其准确度(精度)。④进行因素分析,对于一个因变量受多个自变量(因素)的影响,则可以分清各自变量的主次,和分析各个自变量(因素)之间的互相关系。 7.1 回归分析概述 7.1.1 什么是回归分析 回归分析方法是处理变量之间相关关系的有效工具,它不仅提供建立变量间关系的数学表达式--经验公式,而且利用统计学中的抽样理论来检验样本回归方程的可靠性,具体又可分为拟合程度评价和显著性检验,从而判断经验公式的正确性。 7.1 回归分析概述 7.1.1 什么是回归分析 回归(Regression)也可以称为拟合(Fitting),回归是要找到一个有效的关系,拟合则要找到一个最佳的匹配方程,两者基本是同一个意思。 7.1.2 回归分析的分类 (1)根据方程涉及变量的个数 ①如果只有一个自变量则称为一元回归,其模型如下:y=β0+β1x+ε 其中x为自变量,y为因变量;β0、β1为参数(常数),ε为随机误差项。对于误差项,在回归分析中有如下假设:A.误差项是随机变量,它的期望值为0。B.对于所有的x值,误差项的方差σ2为常数。C.误差项之间相互独立,即与一个值相联系的误差对与另一个值相联系的误差没有影响。D.随机误差项服从正态分布。 7.1.2 回归分析的分类 (1)根据方程涉及变量的个数 ②如果超过一个自变量,则称为多元回归(multiple regression),其模型如下:y=β0+β1x1+β2x2+…+βkxk+ε 其中x1、x2、xk为自变量,y为因变量;β0、β1…为系数(常数项和偏回归系数)。 7.1.2 回归分析的分类 (2)根据自变量和因变量函数关系是直线还是曲线 ①线性回归(linear regression)。 y=β0+β1x+ε为一元线性回归 y=β0+β1x1+β2x2+…+βkxk+ε为多元线性回归(multiple linear regression)。 要注意的是,很多函数关系看起来不像线性相关,但其实完全可以经过数学变换后得到线性关系,例如y=ax+bx2+csin(x),仍然要尽量以线性关系处理。 线性回归主要是根据最小二乘法原理,通过对微分方程组求偏导数,解出各个常数项,从而最终得到定量公式。 7.1.2 回归分析的分类 (2)根据自变量和因变量函数关系是直线还是曲线 ②非线性回归(nonlinear regression)。 y=f(X,β)+ε 这里X是可观察的独立随机变量,β是待估的参数向量,y是独立观察变量,它的平均数依赖于x与β,ε是随机误差。函数形式f()是已知的。 非线性回归(nonlinear curve fitting)处理的情况要比线性回归复杂得多,需要进行更大量的尝试。因此除了依赖计算进行反复运算逼近,用户自己对参数的取值范围和估算也很重要。 7.1.3 回归分析的过程 (1)确定变量。包括变量的个数、自变量和因变量。 (2)确定数学模型。即自变量和因变量之间的关系。确定数学模型有两点要注意,一是能否通过数据变换找到尽可以简单的模块,因为模型越简单,处理越方便,思路越清楚;二是模型中相关参数是否有物理意义,这一点是很重要的,因为实验模型并不是纯数学游戏,计算参数是为了解决问题,因此如果引入的参数没有确定的物理意义,这显然不是一个好的模型,即使这个函数将数据拟合得很好。 7.1.3 回归分析的过程 (3)交由计算机软件进行反复逼近,有必要时进行人为干预。计算机与人类相比的主要好处一是运算速度快得多,二是计算过程精确不会错漏,但如果模型是错误的,则运算结果将会错得更远。因此人为干预是必不可少的。 (4)根据运算结果,特别是相关系数进行检验。理论上相关系数接近1越好,但也要结合常识对结果参数的物理意义特别是取值范围进行判断。 (5)如果结果不满意,则重新修改模型的参
文档评论(0)