- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
直线回归的应用.doc
直线回归的应用
【摘 要】采用最小二乘法配置回归直线,把非线性拟合参数问题加以线性化,进行参数估算,得到回归直线实际应用的数学模型,进行了误差分析,并给出了应用的实例。
【关键词】直线回归;回归方程;方差分析
0.引言
“回归”是个借用已久因而相沿成习的名称。若某一变量Y随另一变量X的变动而变动,则称X为自变量,Y为因变量。这种关系在数学上被称为Y是X的函数,但在其他领域里,自变量与因变量的关系和数学上的函数关系有所不同。例如成年人年龄和血压的关系,通过大量调查,看出平均收缩压随年龄的增长而增高,并且呈直线趋势,但各点并非恰好都在直线上。为强调这一区别,统计上称这是血压在年龄上的回归。
直线回归(linear regression)是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。如果某一个变量随着另一个变量的变化而变化,并且它们的变化在直角坐标系中呈直线趋势,就可以用一个直线方程来定量地描述它们之间的数量依存关系,这就是直线回归分析。回归分析的方法在园艺植物、医学领域等的生产和科学研究中有着广泛的应用,如利用温度或雨量的变化,预测某种园艺植物的主要物侯期 ( 萌芽、开花 ) 、产量、品质以及病虫害发生;应用实生苗的某些性状,预测成年树的某些性状等。
直线回归分析中两个变量的地位不同,其中一个变量是依赖另一个变量而变化的,因此分别称为因变量(dependent variable)和自变量(independent variable),习惯上分别用y和x来表示。其中x可以是规律变化的或人为选定的一些数值(非随机变量),也可以是随机变量,前者称为I型回归,后者称为II型回归。
1.直线回归方程式
将x与y两个变数的n对观察值(x,y),(x,y)...(x,y)分别以坐标点的形式标记于同一直角坐标平面上,作成散点图,如果这两个变数的 n 对观察值在散点图上呈线性,则说明两变数间的数量关系可用直线回归方程来表示。在解析几何上,表示一个平面上的任何直线方程的一般形式为:
=a+bx (1)
上式称为“y依x的直线回归方程”,x是自变量;a是x=0时y的值,也是回归直线在y轴上的截距,叫做回归截距(intercept);b 是回归系数(coefficient of regression),表示x每增加一个单位,y平均将要增加 (b0)或减少(b0)的单位数。
要使(1)式成为实际资料的最佳线性配合,并满足预测要求,必须使观测值yi与回归值偏离达到最小。当变量x取x(i=1,2,???,n)时,可以得到=bx+a(i=1,2,???,n)。它与实际收集到的yi之间的偏差是y-=y-(bx+a)(i=1,2,???,n)。
这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。由于(y-)可正可负,为了避免相互抵消,可以考虑用
y
-代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y-a-bx)???(2)来刻画n个点与回归直线在整体上的偏差。
这样问题就归结为:当a,b取什么值时Q最小,即总体偏差最小。为此分别求Q关于a,b的偏导数,并令他们等于零:
Q(a,b)=
(y-a-bxi)(-2)=0
Q(a,b)=
(y
-a-bxi)(-2x)=0
解得
=
=
-b,其中=x,=y.
此时回归直线为=+x。
通过求(2)式的最小值而得回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法。该方程是实际资料的线性最佳配合。
2.直线回归方程式的计算
例1、测得某地10对父子身高(单位:英寸)如下:
表1
如果x与y之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高。
分析:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归方程。用“最小二乘法”求回归直线方程的关键在于正确地利用回归方程中系数公式求出系数,这样回归方程也就建立起来了。
首先根据实际观测值计算出下列数据:
=∑x/n=668/10=66.8,=∑y/n=670.1/10=67.01
L=∑x-(∑x)/n=44794-(668)/10=171.6
L=∑xy-=44842.4-=79.72
L=∑y-(∑y)/n=44941.93-(670.1)/10=38.529
b===0.465
a=-b=67.01-0.465×66.8=35.948
=35.948+0.465x
所以当父亲的身高为78英寸时
文档评论(0)