回归分析教程.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第七章直线相关与直线回归

第三节直线回归

回归分析是建立描述两变量之间数量关系的直线回归方程,并通过回归方程由一个变量的变化估测另一个变量的变化。

对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的n对观测值:(x1,y1),(x2,y2),……,(xn,yn)

为了直观地看出x和y间的变化趋势,可将每一对观测值在平面直角坐标系描点,作出散点图。

散点图直观地、定性地表示了两个变量之间的关系。为了探讨它们之间的规律性,还必须根据观测值将其内在关系定量地表达出来。

一、直线回归方程的建立

设有两个直线回归变量x和y,x为自变量,y为依变量。观测值数目为n对,以x为横坐标,y为纵坐标建立直角坐标系。

从散点图可看出变数y与x是近似的直线关系,则实际观察值yi可表示为:yi=α+βxi+εi(i=1,2,…,n)。εi为相互独立,且服从正态分布N(0,σ2)的随机误差。α为回归截距,β为回归系数。

上式为直线回归的数学模型。

直角坐标平面上可以作出无数条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。

下面我们讨论直线上的点和散点的关系:

在散点中任取一点P(xi,yi),当x=xi时,直线上与其对应的点为

如果使直线能够近似的代表两个变量的所有散点,则e必须满足:

a、b应使回归估计值与实际观测值y的偏差平方和最小,即:

根据微积分学中的求极值的方法,令Q对a、b的

一阶偏导数等于0,即:

求出使Q为最小值时的a、b的值:

将所得到的方程叫做回归直线方程,相应的直线叫做回归直线.对两个变量所进行的上述统计分析叫做线性回归分析.

回归系数与相关系数一样,其正负符号也取决于SPxy,所以回归系数的正负符号也可说明两变量间相关的性质。

b0,两变量正相关;b0,两变量负相关。

二、回归系数的计算

例题:设从某油松林地随机抽取10株油松,测得胸径与树高见下表,试求树高Y对胸径x的回归方程。

胸径x(cm)4.25.15.96.57.37.78.18.69.09.7

树高y(m)5.74.66.47.87.59.38.49.29.59.6

解:

三、回归直线的绘制

建立了直线回归方程后,我们还可以绘制出回归直线,进而更直观的表达两个变量的直线回归关系。以上题为例。

已知树高对胸径的回归方程为:

试在坐标纸上绘制出该直线。

解:第一步:查原始资料,找出自变量x的最小值和最大值。分别为:4.2cm,9.7cm

第二步:将自变量的两个极值分别代入直线回归方程,计算出其对应的依变量y的估测值。

第三步:建立直角坐标系。以自变量为横坐标,依变量为纵坐标。

第四步:描点并绘制回归直线。先在已经建立的直角坐标系中描出两个极值点(4.2,5.052),(9.7,10.057),然后用线段将其连接起来,标明回归方程的数学表达式即可。

绘制回归直线应注意的问题:

1、绘制回归直线时,必须注意回归方程的定义域。自变量的取值不可以向定义域以为任意延伸。如果要延伸必须对该方程进行验证。因此,所谓的回归直线实际上是包括两个端点的一条线段,在绘制该直线时,不可以任意延长。

2、回归直线必须通过点。利用这个特点,可以验证绘制的直线是否正确。

第四节相关与回归的关系

一、相关与回归的区别

1、相关与回归的含义:

相关是指变量间存在的非确定性关系,变量间的关系被看作是平等的,不需要区别自变量和依变量。它包括变量间的平行关系和从属关系。

回归仅指相关关系中的从属关系(因果关系)。变量间的回归关系作用是有方向的、是单向的、变量间的地位有主从关系。

2、相关与回归的分析目的及其方法不同:

相关分析是通过对相关系数的计算研究变量间相互关系的性质及其密切程度。

回归分析是研究变量间的数量关系。将变量间的关系用数学表达式描述,进而借助一个变量的数值估测另一个变量的数值,并且常通过作图法,直观地描述变量间的数量关系。

3、相关系数与回归系数的意义不同:

相关系数r表示了两个变量之间的相互关系,相关关系的绝对值大小表示了变量间相关关系的密切程度强弱,其正负符号表示了相关的性质。相关系数是个相对值,没有单位。

回归系数b表示了变量间的数量关系,即回归系数表示当自变量x数量变化1个单位时,依变量平均变化的量。回归系数还表示了回归直线的倾斜方向,b0,斜向上;b0,斜向下;b=0,

文档评论(0)

方世玉 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6101050130000123

1亿VIP精品文档

相关文档