6-双变量回归与相关(11硕).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第九章双变量回归与相关;本章内容;变量间关系问题

年龄~身高、肺活量~体重、药物剂量与动物死亡率等

两种关系

依存关系:应变量Y随自变量X变化而变化

———回归分析

互依关系:应变量Y与自变量X间的彼此关系

———相关分析;“回归”(regression)一词最早由英国统计学家F·Galton在一项有关父亲与儿子身高的研究中提出。以父亲的身高作为自变量(independentvariable),儿子的身高作为应变量(dependentvariable),将结果在平面直角坐标系上绘成散点图,发现其趋势近乎一条直线。无论是身材高还是身材矮的父亲所生儿子的身高都有向人群的平均身高“回归”的趋势,这就是“回归”的生物学内涵。;

Galton数据散点图(英寸);例9-1某地方病研究所调查了8名正常儿童的尿肌酐

含量(mmol/24h)如表9-1。

表9-18名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h);Date;回归的一般概念

回归概念的提出表明我们可以用理想化的数学函数关系来解释应变量y与自变量x在数量变化方面的相互数量比例依存关系,因而可以用自变量x的变化来预测应变量y的取值,这是回归分析的数理逻辑基础。

回归分析的目的

用已知或易测或可测的变量对未知或难测或不可测变量的状态进行估计。;LINE假定;最小二乘法原则(leastsquaremethod):使各实际散点(Y)到直线()的纵向距离的平方和最小。即使最小。;Yi(Y的估计值)=a+bXi;因为直线一定经过“均数”点;例9-1某地方病研究所调查了8名正常儿童的尿肌酐

含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)

对其年龄(X)的回归方程。

表9-18名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h);编号;斜率(b)

当X每增加1个单位时,Y改变b个单位

本例b=0.1392,表明在所研究的年龄范围内,年龄每增加1岁,尿肌酐含量增加0.1392mmol/24h

Y的截距(a)

X=0时Y的平均值

本例a=1.6617,表示年龄为0时,尿肌酐含量的期望值为1.6617mmol/24h(注意有时这种解释无实际意义,如本例);回归参数假设检验的目的是判断样本回归系数是否是从回

归系数为0的总体中随机抽取的。或者说,如果总体回归系数

为0???样本回归系数不等于0是否由不寻常的抽样误差所导致。

b≠0原因:①由于抽样误差引起,总体回归系数β=0

②存在回归关系,总体回归系数β≠0;Date;公式 ,υ=n-2

;剩余(残差)标准差SY|X;H0:?=0

H1:??0

??0.05

ν?8-2=6

临界值

;;

Y的离均差平方和的分解;几个平方和的意义;再看公式:

;编号;编号

(1);F统计量的计算;

回归变异MS回(variationcausedbyregression):又称回归均方(meanofsquaresforregression),由于y对x的回归所解释的y的变异。将因变量y与自变量x关联起来进行回归后,回归模型为我们提供了通过给定x估计y的平均水平的途径。因此,y中由于x的作用导致的回归变异就可以被分离出来。其含义也被解释为是x通过回归关系对y的变异产生的贡献。

残差变异MS残(variationcausedbyresiduals):又称残差均方(meanofsquaresforresiduals),由除x以外所有其它因素导致的y的变异,因此,其含义是y的变异中不能由x解释的部分。它在性质上属于随机变异。;Date;五、直线回归方程的区间估计;(二)总体截距a的区间估计;(三)的区间估计;(三)的区间估计;(四)个体Y值的预测区间;(四)个体Y值的预测区间;95%的置信区间与个体Y的预测区间有关数据;;95%的置信区间与个体Y的预测区间图;;残差(residual)是指观测值Yi与回归模型拟合值之差

残差分析(residualanalysis)旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等

例如,第一数据点的残差e1=3.54-3.471=0.069,如此类推,计算出各数据点的残差值。将各数

文档评论(0)

知识改变命运 + 关注
实名认证
文档贡献者

爱好打球

1亿VIP精品文档

相关文档