547SPSS统计分析高级教程(第2版).pdfVIP

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
_二部e 回归模型 第6章多重线性回归模型 6. 1模型简介 . 6.1.1 基本概念 生活中的许多现象都不是相互独立的,而是相互作用、相互影响的。一种结果的出现往往是 多个因素、多个环节共同作用导致的结果。抛开其他因素,仅考察其中一个因素的影响,所得出 的结论可能趋于片面, 甚至是错误的。中国有句古话叫“龙生龙,凤生凤”, 这是反映了遗传因素 对人口素质的影响,但是将其上升到遗传决定论就会大错特错,陈胜、吴广起义时提出的“王侯 将相宁有种乎”就对这一观点进行了无情的批判。 1. 模型框架 本章所要讨论的问题是如何同时考虑多个因素对同一结果的影响。此时,因变量 (Dependent Variable)只有一个,也称为反应变量或响应变量 (Response Variable),常用y表示。自变量 (Inde­ pendent Variable) , 也称解释变量 (Explanatory Variable) , 有多个,P 个自变量用向量形式表示为 (^ , 设有n例观察对象,第i例= …,/〇的一组观察值为,…,*ip)。当因变 量与自变量组之间存在多重线性关系时,应用多重线性回归模型可以很好地表达它们之间的关系: r,- ^h+ei=bo +blxil + ••• +bpxip +e; 由上式可以看出,每个因变量的实测值h由两部分组成:估计值,用9表示,即给定各自变 量取值时因变量y的估计值,它代表的是能由自变量决定的部分为残差,是因变量实测值 与其估计值i之差,表示不由自变ffl决定的部分。对残差的分析是建模过程中的重点。上式中 6。为常数项,它表示当所有自变量取值均为〇时因变量的估计值,乂为偏回归系数,表示当其他 自变量取值固定时,自变量\每改变一个单位时^的变化量 (因为要求其他自变量取值固定,所 以被称为“偏”)。 上式中共有n + 1个参数,如何确定它们的取值?如果从数轴的最左端-〇〇开始,直至数轴 最右端+ 结束,任意地决定这 《 + 1个参数,显然将得到无穷多个回归模型。分别应用这无穷 多个回归模型中对每一条记录求其因变量预测值与实测值之差的平方和-i)2,并将其累 加,那么每个回归模型都会得到一个累加值Z (h _i)2,而该数值最小的那个回归模型就是人 们所需要的, 这就是所谓的最小二乘法(Least Square )。换言之,就是使得以下指标最小: n n Q = ( - y;) = ^ _ (厶〇 + 厶Wii + 厶2¾ + …+ 厶;|\)] i=l i=l 2. 适用条件 应用多重线性回归进行统计分析时要求资料满足以下条件。 (1)自变量与因变量之间存在线性关系, 这可以通过绘制“散点图矩阵”予以考察,如果因 98 第6章多重线性回归模型 变量与某个自变量〜之间呈现出曲线趋势,可尝试通过变量变换予以修正,常用的变量变换 方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等。 (2) 各观测间相互独立,即任两个观测残差的协方差为0。 (3) 残差e,服从正态分布# (02)。其方差tr2 =Var (ei)反映了回归模型的精度,cr越小, 用所得到回归模型预测y的精确度越高。 (4) 的大小不随所有变量取值水平的改变而改变,即方差齐性。 此外,为了保证参数估计值的稳定,还需要注意模型的样本量要求。有学者认为样本置应当 在希望纳入模型的自变量数20倍以上为宜。比如模型中希望纳人5个自变量,则样本量应当在 100以上, 少于此数则可能会出现检验效能不足的问题。当然,如果检验结果为有统计学意义, 该结论并非不可信,但在解释时要加倍小心,需要牢记系数估计值可能并不稳定。 0、多重线性回归模型对自变量没有具体的分布限定,只要求所有的自变量值都能被准确测 量,并且各自变量之间独立无关联。 在SPSS中可以选择“分析回归线性”菜单项进行多重线性回归。 6. 1.2分析步骤 回归分析被应用得

文档评论(0)

186****8391 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档