- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归与相关分析
第 PAGE \* Arabic 6 页第 PAGE \* Arabic 6 页
回归与相关分析
回归分析简介
现实世界中变量之间的关系可以分成两类,一类是确定关系,这种关系可以使用函数来进行分析和描述;另一类关系是不确定关系,这种关系称为相关关系,如气温、降雨量与农作物的产量之间的关系,人的年龄与血压之间的关系等,都是不能用函数关系来表达的,但是它们之间确实存在着某种关系。回归分析是研究相关关系的一种数学工具。它能帮助我们从一个或几个变量去估计另一个难以确定的量。
在以前的讨论中我们遇到的都只有关于一个对象的一组样本,现在假如我们的观察对象是两个,这样就每次就可以得到一对样本观察值,这些值也都是随机变量。我们用X,Y表示它们。
例如,考虑人的身高与体重。如果我们用X表示身高,Y表示体重。我们获得的第i对观察值为,如果接受测量的人有n个人,则样本的容量为n。其中n对数据可以表示如下:
X Y
…
我们现在的目的就是要建立Y与X的关系。其中一种常用的方法就是回归分析方法。回归分析就是采用统计的方法估计随机变量Y与X之间的关系式。
相关分析也是一种分析随机变量Y与X之间的关系的一种方法。而它着重考虑的是Y与X之间的相关程度(相关系数)与相关方式(方向、系数),其分析结果就是两个变量之间的相关系数。
相关分析与回归分析是紧密结合的,常常一起使用。一般说来,采用相关分析确定变量之间是否确实有相关关系存在,如果存在,则用回归分析求出变量之间的定量关系表达式。
在回归分析中,通常对我们感兴趣的变量,或需要估计的量称为因变量,记为y。对于随机变量y来说,如果我们要估计它,最重要的就是它的均值。显然,由于y是一个随机变量。因此
(1)
其中,E(y)是y的数学期望,ε是随机误差,它是不可预测的。即随机变量y的等于它的均值加上一个正或负的随机误差。由于随机误差ε的均值为0,因此对随机变量y的最好估计为E(y)。
但是我们并不知道总体的均值E(y),因此只能通过样本的均值来进行估计,因此有,
(2)
上式中表示y的估计值,表示y的样本均值。
由于因变量y与一个或几个自变量之间存在相关关系,因此,只要给出一组y与x的样本值,就可以确定(2)式,从而在给定x的情况下确定y的估计量。
回归分析与相关分析具有非常广泛的应用,尤其是在管理活动中。
一元线性回归分析
一元回归分析
在进行回归分析时,我们必需知道或假定在两个随机之间存在着一定的关系。这种关系可以用Y的函数的形式表示出来,即Y是所谓的因变量,它仅仅依赖于自变量X,它们之间的关系可以用方程式表示。在最简单的情况下,Y与X之间的关系是线性关系。用线性函数a+bX来估计Y的数学期望的问题称为一元线性回归问题。即,
上述估计问题相当于对x的每一个值,假设,而且,,其中a, b, σ2都是未知参数,并且不依赖于x。对y作这样的正态假设,相当于设,
(3)
其中,为随机误差,a, b, σ2都是未知参数。
这种线性关系的确定常常可以通过两类方法,一类是根据实际问题所对应的理论分析,如各种经济理论常常会揭示一些基本的数量关系;另一种直观的方法是通过Y与X的散点图来初步确认。
对于公式(3)中的系数a、b,需要由观察值来进行估计。如果由样本得到了a,b的估计值为,则对于给定的x,a+bx的估计为,记作,它也就是我们对y的估计。方程
(4)
称为y对x的线性回归方程,或回归方程,其图形称为回归直线。
例1:有一种溶剂在不同的温度下其在一定量的水中的溶解度不同,现测得这种溶剂在温度x下,溶解于水中的数量y如下表所示:
xi
0
4
10
15
21
29
36
51
68
yi
66.7
71.0
76.3
80.6
85.7
92.9
99.4
113.6
125.1
这里x是自变量,y是随机变量,我们要求y对x的回归。
其散点图如下:
确定回归系数
在样本的容量为n的情况下,我们我们可以得到n对观察值为。现在我们要利用这n对观察值来估计参数a,b。显然,y的估计值为,
在上式中a,b为待估计的参数。估计这两个参数的方法有极大似然法和最小二乘法。其中最小二乘法是求经验公式时最常用的一种方法,也最简单。现在就采用这种方法。
当我们做出这一对变量观察值的散点图后,我们可以看出,我们所要求的回归直线,实际上是这样的一条直线,即,使所求的直线能够最好的拟合已有的所有点,或者说要使图上所有的点到这条直线的距离最近。因此所要求的直线实际上就是使所有的点与这条直线间的误差最小的直线。
我们用表示y的样本观察值,表示根据回归方程所得到的y的估计值,则估计值与实际观察值之间的误差为,
(5)
其总的误差,可以表示为误差的平方和的形式,
(6)
现在要
原创力文档


文档评论(0)