- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
多元线性回归spss案例
【篇一:多元线性回归spss案例】
多元线性回归,主要是研究一个因变量与多个自变量之间的相关关
系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些
而已,例如:一元线性回归方程为:
毫无疑问,多元线性回归方程应该为:
上图中的x1,x2,xp分别代表自变量xp截止,代表有p个自变量,
如果有n组样本,那么这个多元线性回归,将会组成一个矩阵,如
下图所示:
那么,多元线性回归方程矩阵形式为:
其中:代表随机误差,其中随机误差分为:可解释的误差和不可
解释的误差,随机误差必须满足以下四个条件,多元线性方程才有
意义(一元线性方程也一样)
1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。
2:无偏性假设,即指:期望值为0
3:同共方差性假设,即指,所有的随机误差变量方差都相等
4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协
方差解释。
今天跟大家一起讨论一下,spss多元线性回归的具体操作过程,
下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。
通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模
型。数据如下图所示:
点击分析回归线性进入如下图所示的界面:
将销售量作为因变量拖入因变量框内,将车长,车宽,耗油率,
车净重等10个自变量拖入自变量框内,如上图所示,在方法旁边,
选择逐步,当然,你也可以选择其它的方式,如果你选择进入默
认的方式,在分析结果中,将会得到如下图所示的结果:(所有的
自变量,都会强行进入)
如果你选择逐步这个方法,将会得到如下图所示的结果:(将会根
据预先设定的f统计量的概率值进行筛选,最先进入回归方程的自
变量应该是跟因变量关系最为密切,贡献最大的,如下图可以看出,
车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必
须小于0.05,当概率值大于等于0.1时将会被剔除)
选择变量(e)框内,我并没有输入数据,如果你需要对某个自变量
进行条件筛选,可以将那个自变量,移入选择变量框内,有一个前
提就是:该变量从未在另一个目标列表中出现!,再点击规则设定
相应的筛选条件即可,如下图所示:
点击统计量弹出如下所示的框,如下所示:
在回归系数下面勾选估计,在右侧勾选模型拟合度和共线性诊断
两个选项,再勾选个案诊断再点击离群值一般默认值为3,(设
定异常值的依据,只有当残差超过3倍标准差的观测才会被当做异
常值)点击继续。
提示:
共线性检验,如果有两个或两个以上的自变量之间存在线性相关关
系,就会产生多重共线性现象。这时候,用最小二乘法估计的模型
参数就会不稳定,回归系数的估计值很容易引起误导或者导致错误
的结论。所以,需要勾选共线性诊断来做判断
通过容许度可以计算共线性的存在与否?容许度tol=1-ri平方或方
差膨胀因子(vif):vif=1/1-ri平方,其中ri平方是用其他自变量预测
第i个变量的复相关系数,显然,vif为tol的倒数,tol的值越小,
vif的值越大,自变量xi与其他自变量之间存在共线性的可能性越大。
提供三种处理方法:
1:从有共线性问题的变量里删除不重要的变量
2:增加样本量或重新抽取样本。
3:采用其他方法拟合模型,如领回归法,逐步回归法,主成分分析
法。
再点击绘制选项,如下所示:
上图中:
dependent(因变量)zpred(标准化预测值)zresid(标准化残差)
dresid(剔除残差)adjpred(修正后预测值)srsid(学生化残差)
sdresid(学生化剔除残差)
一般我们大部分以自变量作为x轴,用残差作为y轴,但是,也
不要忽略特殊情况,这里我们以zpred(标准化预测值)作为x轴,
分别用sdr
文档评论(0)