网站大量收购独家精品文档,联系QQ:2885784924

多元线性回归与相关概要.ppt

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元线性回归与相关概要

多元线性回归与相关 浙江大学公共卫生学院 流行病与卫生统计教研室 沈毅 2005.6 多元线性回归与相关 直线回归与相关是分析一个应变量Y与一个自变量X之间的关系。但通常是一个应变量受到许多因素的影响,例如一个人的收缩压受到年龄、饮食、锻炼及遗传等许多因素的影响。因此,必须把直线回归与相关的分析方法推广为多个自变量的分析方法,从而起到更有效的预报、控制及识别影响因素的作用。 第一节 多元线性回归模型 一、多元线性回归方程的建立 多元线性回归模型为: 式中βj是Xj(j=1,2,…,p)对 Y的偏回归系数( Partial regression coefficient),它表示在其它自变量固定不变的情况下,Xj每改变一个测量单位时所引起的应变量 Y的平均改变量,p为自变量的个数,ε为残差,独立服从 N(0,σ2)分布。 拟寻求参数β0,β1,… βp的适宜估计值 b0,b1,bp,使观察值Yi和回归预测值 之间残差平方和最小,即 根据微积分知识,b0,b1,bp必须满足联立方程组: 该方程组也称为正规方程组。可将该正规方程化为 其解即为β0,β1,… βp的最小二乘估计值。 上述正规方程组可以用矩阵形式简洁地表示,令: 矩阵X含n行(p+1)列,除第1列外其余恰好是关于X的原始数据,每一行属于一个个体,行向董Y的每一个元素属于一个个体,列向量B即为欲求的参数估计值,式(15-2)左端的系数构成的矩阵为: 其中X’是X的转置矩阵,为X的行列互换所得,右端的参数项可以写成: 故正规方程组的矩阵形式为 其解可以表示为: 其中 表示系数矩阵 的逆矩阵。可见,回归参数的最小二乘估计实为系数矩阵之逆矩阵与常数项矩阵(列向量)之乘积。其计算较为复杂,可以用统计软件求得。 用最小二乘法解出偏回归系数βj的估计值bj后,得到相应的多元线性回归方程为: 下面举例说明建立多元线性回归方程的过程。 二、例子 例15-1 为研究男性高血压患者血压与年龄体重等变量的关系,随机测量了32名40岁以上男性的血压(mmHg)、年龄(岁)、身高、体重、以及吸烟史。其中体重指数 Qutelet index=100(体重/身高2); 吸烟:0为不吸,1为过去或现在吸烟。(见表15-1) 由表15-2可知有关参数估计值为:b0=44.293,b1=1.778,b2=9.623。b1=1.778表示 40岁以上男性吸烟状态不变的条件下,年龄每增加五岁,收缩压平均提高1.778mmHg;b2=9.623表示年龄不变的条件下,吸烟者与不吸烟者相比,收缩压平均提高 9.623 mmHg。于是得到回归方程: 第二节 回归系数的假设检验 选用多元线性回归描述一组观察资料时,不可避免地带有一定的主观性和抽样误差。因此,必须对所建立的回归方程进行拟合适度检验,以分析应变量 Y与各自变量Xj之间是否存在线性关系。多元线性回归方程拟合适度检验可分为两种:一种是对整个方程的检验,另一种是对各偏回归系数的假设检验。下面分别介绍。 一、多元线性回归方程的假设检验 可用方差分析方法来检验应变量Y与p个自变量之间是否存在线性回归关系。检验假设为: H0:βj均为0;H1:βj不全为0;j=1,2,…,p. α=0.05。 在多变量情形下,应变量总离均差平方和 SS总可以分解为回归平方和SS回与残差平方和SS =两部分,它们的简便计算公式以及相应的自由度为: 统计量F的计算公式为: 式中MS回及MS残分别称为回归均方与残差均方。在无效假设H0:Bj均为零的条件下统计量F服从F(p,n-p-1)分布。如果F≥F α(p,n-p-1),则在α水准上拒绝H0,认为p个自变量X中至少有一个与应变量 Y之间存在线性回归关系。否则不拒绝 H0,即认为所有X与应变量 Y之间无线性回归关系。 由表15-3得到对方程的检验结果为:F=52.40,P=0.0001,故在α=0.05水平上拒绝H0,可认为年龄和吸烟对血压的影响总的来说具有统计学意义。 二、偏回

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档