- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十三讲 简单线性相关(一元线性回归分析)
对于两个或更多变量之间的关系,相关分析考虑的只是变量之间是否相关、 相关的程度,而回归分析关心的问题是:变量之间的因果关系如何。回归分析是 处理一个或多个自变量与因变量间线性因果关系的统计方法。如婚姻状况与子女 生育数量,相关分析可以求出两者的相关强度以及是否具有统计学意义,但不对 谁决定谁作出预设,即可以相互解释,回归分析则必须预先假定谁是因谁是果, 谁明确谁为因与谁为果的前提下展开进一步的分析。
一、一元线性回归模型及其对变量的要求
一元线性回归模型
1、一元线性回归模型示例
两个变量之间的真实关系一般可以用以下方程来表示:
Y=A + BX + £
方程中的A、B是待定的常数,称为模型系数,£是残差,是以X预测Y 产生的误差。
两个变量之间拟合的直线是:
y = a + bx
y是y的拟合值或预测值,它是在X条件下Y条件均值的估计
a、b是回归直线的系数,是总体真实直线A、B的估计值,a即constant是截 距,当自变量的值为0时,因变量的值。b称为回归系数,指在其他所有的因 素不变时,每一单位自变量的变化引起的因变量的变化。
J
- CCT(丑y) 团(F- P) - AT- F)
V3T(^) v (T- J) - X1 -(X XV
可以对回归方程进行标准化,得到标准回归方程:
£ = x
p为标准回归系数,表示其他变量不变时,自变量变化一个标准差单位
(Z = Xj Xj),因变量Y的标准差的平均变化。
D
j
由于标准化消除了原来自变量不同的测量单位,标准回归系数之间是可以比 较的,绝对值的大小代表了对因变量作用的大小,反映自变量对Y的重要性。
(二) 对变量的要求:回归分析的假定条件
回归分析对变量的要求是:
自变量可以是随机变量,也可以是非随机变量。自变量X值的测量可以认为 是没有误差的,或者说误差可以忽略不计。
回归分析对于因变量有较多的要求,这些要求与其它的因素一起,构成了回 归分析的基本条件:独立、线性、正态、等方差。
(三) 数据要求
模型中要求一个因变量,一个或多个自变量(一元时为1个自变量)。
因变量:要求间距测度,即定距变量。
自变量:间距测度(或虚拟变量)。
二、在对话框中做一元线性回归模型
例1:试用一元线性回归模型,分析大专及以上人口占6岁及以上人口的比 例(edudazh)与人均国内生产总值(agdp)之间的关系。
本例使用的数据为st2004.sav,操作步骤及其解释如下:
(一)对两个变量进行描述性分析
在进行回归分析以前,一个比较好的习惯是看一下两个变量的均值、标准差、 最大值、最小值和正态分布情况,观察数据的质量、缺少值和异常值等,缺少值 和异常值经常对线性回归分析产生重要影响。最简单的,我们可以先做出散点图, 观察变量之间的趋势及其特征。通过散点图,考察是否存在线性关系,如果不是, 看是否通过变量处理使得能够进行回归分析。如果进行了变量转换,那么应当重 新绘制散点图,以确保在变量转换以后,线性趋势依然存在。
打开 st2004.sav 数据 f 单击 Graphs f Scatter f 打开 Scatterplot 对话框 f单击Simple f 单击Define f打开Simple Scatterplot对话框 f 点选agdp到Y Axis框 f 点选edudazh到X Aaxis框内 f 单击OK 按钮f 在SPSS的Output窗口输出所需图形。
图12-1大专及以上人口占6岁及以上人口比例与人均国内生产总值的散点图
年人均国内生产总值元
判断:线性趋势较明显。
(二)SPSS线性回归主对话框介绍
打开线性回归主对话框的操作方法是:
在 st2004.sav 数据界面上 单击 Analyze 一 Regression一Linear一打开 Linear Regression 主对话框
图 12 — 2 Linear Regression 命令位置
图 12 — 3 Linear Regression 主对话框
圈择统伟备选择满足条件 的记录进入回 归分析啜地区类别[qlql] 外 麒省愉(dqO? 3004年农村居民主 够30。尊国内生产_£ 蠹20。峙第一产业六20Ck|年条二产业任 ? 30D砰
圈择统伟备
选择满足条件 的记录进入回 归分析
啜地区类别[qlql] 外 麒省愉(dqO
? 3004年农村居民主 够30。尊国内生产_£ 蠹20。峙第一产业六
20Ck|年条二产业任 ? 30D砰城笛居民土 磅2004^房地严井龙 金2W昨商品房蜻宣 翁2004年撅蝌居民§ 金30时年农村居民妥 蠢EDg女盲半文W 卷如口展枚业产值日 念ZOD畀第三产业户 煽2004^非农出蜀舌 金NOClg识字搴尤[r 焰却
原创力文档


文档评论(0)