4-线性回归分析.pptVIP

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
线性回归分析 公共卫生学院 一. 前言 回归分析的目的: 设法找出变量间的依存(数量)关系, 用函数关系式表达出来 二、基本概念 1、应变量(dependent variable) 2、自变量(independent variable) 3、一元线性回归   直线回归方程的模型是:yi=a+bxi+ei 其中 (1)a是截距 (2)b是回归系数(regression coefficient)(回归直线的斜率) 回归系数的统计学意义是:自变量每变化一个单位,应变量平均变化的单位数. (3)ei是残差 因此直线回归方程的一般形式是: 其中 是应变量y的预测值或称估计值。 4、多元线性回归 多元线性回归方程模型为: yi=b0+b1x1i+b2x2i+…+bnxni+ei 其中 b0是常数项,是各自变量都等于0时,应变量的估计值。有时,人们称它为本底值。 b1,b2,…,bn是偏回归系数( pertial regression coefficient ),其统计学意义是在其它所有自变量不变的情况下,某一自变量每变化一个单位,应变量平均变化的单位数。 如果所有参加分析的变量都是标准化的变量,这时b0就等于0, b1,b2,…,bn 就变成了标准化偏回归系数,用符号b1‘,b2’,…,bn‘表示。 bi’= bi*sxi/sy 由于bi’没有量纲,因此可以相互比较大小,反映自变量的相对作用大小。 (3) ei是残差 多元线性回归方程的一般形式是: 其中的符号含义同前。 三、理论假设 自变量x与应变量y之间存在线性关系; 正态性:随机误差(即残差)e服从均值为 0,方差为?2的正态分布; 等方差:对于所有的自变量x,残差e的条件方差为?2 ,且?为常数; 独立性:在给定自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设); 无自相关性:各随机误差项e互不相关; 残差e与自变量x不相关:随机误差项e与相应的自变量x不相关; 无共线性:自变量x之间相互独立. 四、回归方程的建立 散点图 奇异点(ouliers) 最小二乘法(least square, LS) 残差平方和(sum of squares for residuals) 一元线性回归时,计算比较简单: 多元线性回归时,比较复杂,一般需要用计算机处理。 五、线性回归的检验 1、回归方程的检验  方差分析法: 应变量的总变异 可分解为 回归平方和(regression sum of squares):可用线性回归解释的部分 剩余平方和(residual sum of squares):即残差平方和,不能用线性回归解释的部分 以上三部分的自由度分别为n-1,m和n-m-1。其 中,n为样本数,m为自变量数。 方差分析的假设为 一元线性回归:H0: ?=0     H1: ??0 多元线性回归: H0: ?1= ?2=…= ?m=0 H1: ?1, ?2,…, ?m中至少有一个不等于零 因此方差分析的结论是线性回归方程是否显著,是否有意义。 2、回归/偏回归系数的检验    检验回归系数是否为零,每一个偏回归系数是否为零。用t检验方法。  统计量   自由度  结论:回归/偏回归系数是否有意义,是否为零;对应的自变量是否有意义。 3、常数项(截距)的检验 检验常数项(截距)是否为零。 用t检验方法。 一元线性回归: H0: ?=0        H1: ? ?0 多元线性回归: H0: ?0=0      H1: ?0?0 4、模型的预测效果检验    亦称回归模型的拟合优度检验。检验回归模型对样本数据的拟合程度。 决定系数(determination coefficient)( R square) 调整(校正)决定系数(adjusted R square) 复相关系数R (multiple correlation coefficient) 5、线性回归适用性检验 (1)回归模型残差的正态性检验 残差的直方图 残差的累积概率图(P-P图) (2)回归模型残差的独立性检验 用Durbin--Watson检验,其参数称为Dw或D。D的取值范围是0<D<4。其统计学意义为: D≈2,残差与自变量相互独立; D<2,残差与自变量正相关; D>2,残差与自变量负相关。 (3)残差的方差齐性检验 以上都是对残差的分析,称为残差分析。残差分析还可以1)检出奇异点 2)评判预测效果。 (4)共线性诊断

文档评论(0)

小玉儿 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档