(34)一元线性回归.docxVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

PAGE

PAGE25

第六章回归分析

引言:

回归分析是数理统计学的一个重要组成部分。它的任务是研究变量之间的相互关系,建立变量之间的经验公式,以便达到预测和控制*的目的。

函数关系:y=f(x),

例如:正方形的边长x,面积y=x2;

球的半径x,球的体积。

相关关系:y=f(x)+?,

例如:一个人的身高x与体重y的关系。

模型:y=f(x)+?(*)

其中x是普通变量(非随机),y是随机变量,E?=0。

x是一维变量时,称为一元回归模型;

x是多维变量时,称为多元回归模型。

f(x)称为y对x的回归函数;

y=f(x)称为y对x的回归方程。

x称为自变量,或解释变量;

y称为因变量、被解释变量或响应变量。

f(x)为线性函数的情形,称为线性回归。

一元线性回归模型:

其中?0、?1是未知参数,?是随机误差,假设?~N(0,?2);

多元线性回归模型:

,(p1)

其中?0,?1,…,?p是未知参数,?是随机误差,假设?~N(0,?2)。

§6.1一元线性回归

本节内容分四个部分:

1.建立一元线性回归模型:

,?~N(0,?2);

2.估计未知参数?0、?1和?2,得到经验回归方程

3.检验H0:?1=0,H1:?1≠0;

4.若?1≠0,将经验回归方程用于预测。

模型

例:从某个年龄男孩中任意挑选10名,测量他们的身高和体重得数据:

身高x(cm)

157

167

165

158

155

156

164

160

158

163

体重y(kg)

46

55

52

46

42

45

49

47

44

49

体重y随身高x的增长而直线增长的趋势可描述为:

其中,?0、?1为常数,?为随机变量,且E?=0。

记身高为xi的学生体重为yi,(yi是随机变量),则

,()。

其中,?1,?2,…,?10独立,假定?i~N(0,?2),(),?2未知。

上面例子中,x1=157,y1有一个取值46;

x2=167,y2有一个取值55;

x10=163,y10有一个取值49;

问题的一般提法:

,(1)

假定。

对应于x的n个不全相同的值x1,x2,…,xn,有n个随机变量y1,y2,…,yn,有

,()(2)

其中,独立,,(),

?0、?1、?2是未知参数。

通常称(2)为一元线性回归模型,而(1)称为理论模型。

参数?0、?1和?2的估计

1.?0、?1的最小二乘估计

若b0,b1,则yi有预测值,

()。

观测值:,,…,

预测值:,,…,

以下确定b0、b1使得最小。

记,,

+b12

-2b1

其中,,。

所以,当

b1(*)

b0

时,即最小。

使得最小的b0、b1称为?0、?1的

最小二乘估计量。即

b1,b0。

称为y关于x的经验回归方程,其图形称为回归直线。

得,

有回归直线必通过散点图的几何中心。

记,,称为y在x=xi处的预测值(拟合值或回归值)。

2.?2的估计

(1)残差平方和

SSe=

称为残差平方和(或剩余平方和)。

这里b0,b1由(*)确定。

残差平方和的计算:

SSe=+b12-2b1

=+b12-2b1

=-b12

(注意:上式中的,

不是样本方差)

(2)?2的估计

SSe==,

可以证明:,(参看浙大教材)。

所以,

?2有无偏估计:

(教材P169记为,

称为回归剩余标准差)

3.最小二乘估计量b0、b1是?0、?1的无偏估计:

模型:,(),

E(yi)=?0+?1xi,

=?0+?1,

E(b1)=E

?1

E(b0)=E=(?0+?1)-E(b1)=?0。

即b0、b1是?0、?1的无偏估计(最小方差线性无偏估计)。

/*:

注意到:,()

其中,独立。所以,

()

且y1,y2,…,yn独立。所以,

即b1是独立正态变量y1,y2,…,yn的线性组合,

b1服从正态分布。

可见,的取值越分散越好。*/

4.b0、b1的计算:

b1的分子:

b1的分母:,

所以,,

例:从某个年龄男孩中任意挑选10名,测量他们的身高和体重得数据:

身高x(cm)

157

167

165

158

155

156

164

160

158

163

体重y(kg)

46

55

52

46

42

45

49

47

44

49

求体重关于身高的经验回归方程。

解:

n=10,,,

,,

=0.8808,

=-93.56。

为男生体重关于身高的经验回归方程。

文档评论(0)

逍遥子 + 关注
实名认证
文档贡献者

互联网搬运工

1亿VIP精品文档

相关文档