第八次作业 第三组1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八次作业 第三组1

回归分析的spss过程 目录 线性回归 线性回归分析(Linear Regression)是研究一个因变量和一个或多个自变量之间是否存在某种线性关系的统计学方法。如果参与回归分析的自变量只有一个,就是一元线性回归分析。如果参与回归分析的变量有多个,则是多元线性回归。 壹 一元线性回归分析 建立一元线性回归模型的步骤: 根据数据资料作散点图,直观判断两变量之间是否大致成一种直线关系 设直线方程Y=α+βX 选用平均数法或最小二乘法,或其他方法用实际数据计算α和β的值。 将α、β的值代入表达式,得到回归方程。 一元线性回归方程的有效性检验: (1)回归方程的显著性检验 F检验 回归方程是否有效 (2)回归方程的拟合优度 判定系数R2 X与Y之间是否存在显著性的线性关系 方差分析虽然可以告诉我们回归方程是否有效,但不能告诉有效性的大小。所以我们还需要一个能够判定回归方程有效性大小的系数R2。 残差分析 残差是指由回归方程计算所得的预测值与实际样本之间的差距。如果回归方程能较好地反映被解释变量的特征和变化规律,则残差中应该不包含明显的规律性和趋势性。 1、检查残差序列是否独立。Durbin-Watson 检验法。DW统计量的取值范围在0~4之间。当DW2,认为两残差之间为正相关;当DW2,负相关;当DW近似为2时,才认为两残差之间是相互独立的。 2、残差的正态性检验可以通过P-P图来检验。 例: 某研究所10名学生研习某教授的高级统计课程,期中与期末考试成绩如下;请问该教授是否可以利用期中考试成绩来预测期末考试成绩? 绘图,可以分析数据资料的正态性、线性和差齐性,还可以检测奇异值。 DEPENDENT 因变量 *ZPRED 标准化预测值,y * ZRESID 标准化残差 1.建库; 因为是一元线性回归,所以方法直接是进入。 2.点击“分析”、“回归”、“线性”,出现如图界面; 3.由题意选定自变量和应变量。 4.统计量我们默认系统: “估计”及“模型拟合度” 点击“继续” 点击“确定” 检验残差项间是否存在自我相关 “ZPRED”为标准化的预测值;“ZRESID”为删除后的标准化残差值。 标准化残差值方框中有直方图和正态概率图两个选项,用来检核残差值是否呈正态分布。 由表三可知:F对应的P值等于0.005,小于0.05,所以,我们认为回归模型的建立是显著的,可以用期中成绩预测期末考试成绩; 由表四可知:t对应的P值等于0.005,小于0.05,所以我们认为回归系数0.415是显著的,可以用期中成绩预测期末考试成绩; 5.结果分析 我们对残差进行了统计。 贰 多元线性回归分析 某研究机构为研究儿童智力状况,调查了16所小学的平均语言测试得分(y)与家庭经济状况指标(x1)、教师语言测试得分(x2)与母亲教育水平(x3)的数据。试进行多元线性回归分析。 例: 表1 描述性统计量表,该表显示各变量的均值、标准差和例数。 表2 相关性, 该表显示了各变量间的Pearson相关系数和显著性检验单侧概率P值。例、x3与y的相关系数为0.809 ,单侧概率P为0.000。x1与x2的相关系数为0.524,x1与x3的相关系数为0.693,x2与x3的相关系数为0.382,都小于0.7,x1,x2,x3之间不存在多重共线。 表3 输入/移去变量表, 显示了回归方程的方法以及变量被剔除或引用的信息。从表中可以看出,模型最先引入变量x3。 表4 模型汇总,该表显示了各模型的拟合度情况。从表中可以看出,模型1的复相关系数为0.809,判定系数为0.655,调整判定系数为0.630,估计值的标准误差为3.98861.自变量解释了整个因变量变异程度的63.0%。 表5 方差分析表 ,模型1 Regression的F统计量的观察值为26.572,概率P值为0.000,在显著性水平为0.05的情形下,可以认为y与x2和x3之间有线性关系。 表6 线性回归系数列表,根据模型建立的多元线性回归方程为: y=8.217+1.594x2+0.809x3 表7 以排除的变量, 可见模型2方程外的各变量偏回归系数经重检验,概率P值分别为0.520和0.784,均大于给定的显著性水平,故不能引入方程。 表8 共线性判断 。 表9 回归模型的残差统计量,标准化残差的绝对值大于1.869,没有超过3。 谢谢

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档