多元线性回归SPSS.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元线性回归SPSS.ppt

2007-5-14 多元线性回归分析 SPSS 方法:是简单直线回归的推广,研究一个应变量与多个自变量之间的数量依存关系。 。 资料:应变量(Y)为定量指标;自变量(xi)全部或大部分为定量指标,若有少量定性或等级指标需作转换。 多元线性回归模型的应用条件: 1.线性趋势(linear):自变量与因变量的关系是线性的,即Y与Xi间具有线性关系 2.独立性(independence):应变量Y的取值相互独立,Cov(ei,ej)= 0 3.正态性(normality):对任意一组自变量取值,因变量Y服从正态分布,ei~N(0,σ2), 4.方差齐性(homogeneity):对任意一组自变量取值,因变量y的方差相同,Var(ei)=σ2 后两个条件等价于:残差ε服从均数为0、方差为σ2的正态分布 表2 27名糖尿病人的血糖及有关变量的测量结果 方程的求解过程复杂,可借助于SPSS等统计软件来完成 SPSS:分析→回归→线性→因变量:Y 自变量:x1-x4 SPSS的操作界面 SPSS结果 模型适用条件的检验 用张文彤SPSS高级篇中的数据reg为例 一、线性趋势 (1)散点图矩阵 (2)未标准化残差与该自变量(x1、x2)的散点图 模型适用条件的检验 二、各观测间相互独立:即任两个观测残差的协方差为0,可利用残差图提供直观的信息,对于残差间是否相互独立可通过线性回归中统计量按钮中提供的Durbin-Watson检验进行判断 模型适用条件的检验 模型适用条件的检验 三、残差ei服从正态分布 可以通过绘制标准化残差的直方图、PP图(正态概率图)和茎叶图进行。 模型适用条件的检验 模型适用条件的检验 模型适用条件的检验 模型适用条件的检验 模型适用条件的检验 方差齐性:即残差的大小不随所有变量取值水平的改变而改变,上面的plot子对话框提供两绘制反应变量与各种残差的残差图,以标准化残差为Y轴,已标准化预测值为X轴 二、逐步选择法 1.前进法 (forward selection) 2.后退法(backward elimination) 3.逐步回归法 (stepwise regression) 逐步回归法 是进行双向筛选的一种方法。 自变量回归平方和最大的Xi首先进入方程,在Xi进入方程的基础上计算其余m-1个自变量分别进入回归方程时的偏回归平方和,其中最大者记为SSj,对Xj进行基于偏回归平方和的F检验,若有意义则进入方程,并重新对Xi进行检验。若Xi退化为无意义,则剔除Xi,同时再对Xj进行检验。若Xj依然有意义则继续选择下一个偏回归平方和最大者并进行检验。重复此过程,直到既没有自变量需要引入方程,也没有自变量从方程中剔除为止,从而得到一个局部最优的回归方程。 逐步回归法 每引入或剔除一个自变量后都要重新对已进入方程中的自变量进行检验,直到方程外没有有意义的自变量可引入、方程内也没有无意义的自变量可剔除为止。 逐步回归法 “先剔除后选入”原则 α入≤α出引入变量的检验水准要小于或等于剔除变量的检验水准。 逐步回归法实例(令α入=0.10,α出=0.15) 多元线性回归的应用及其注意事项 一、多元线性回归的应用 1.影响因素分析:控制混杂因素 2.估计与预测: 预测:由自变量值推出因变量Y的值、容许区间和总体均数的可信区间。 新生儿体重(Y)=b0+b1胎儿孕龄(X1)+ b2 胎儿头径(X2)+ b3胎儿胸径(X3)+ b4胎儿腹径(X4) 心脏表面积(Y)=b0+b1心脏横径(X1)+ b2心脏纵径(X2)+ b3心脏宽径(X3) 3.统计控制: 利用回归方程进行逆估计,确定Y后控制X。 采用射频治疗仪治疗脑肿瘤: 脑皮质毁损半径(Y) =b0+b1射频温度(X1)+ b2照射时间(X2) 二、多元线性回归应用的注意事项 1.指标的数量化 应变量Y为连续变量 自变量X可为连续、有序分类或无序分类变量 (1)连续变量:X (2)有序分类变量: 1 轻 X= 2 中 3 重 当自变量为分类变量时的赋值方法 自变量为二分类变量时 自变量为多分类变量时:假定有k类,则k-1个取值为0或1的哑变量(dummy variables)完整地标记出这些类别。 无序多分类自变量的哑变量化 2.样本含量 n至少是X个数m的5~10倍 3.关于逐步回归 对逐步回归得到的结果不要盲目的信任,结合专业知识。所谓的“最优”回归方程并不一定是最好的,没有选入方程的

文档评论(0)

rewfdgd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档