实验四线性回归分析.pptxVIP

实验四线性回归分析.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验四线性回归分析

一、实验目的 掌握spss 绘制散点图和计算相关系数的方法 掌握回归分析的一般步骤和回归的统计检验(包括回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验和残差分析) 二、实验内容 1、练习教材中P264案例8-1,通过绘制散点图,分析家庭收入与打算购买的住房面积存在怎样的统计关系,数据文件为“住房状况调查.sav” 图形→旧对话框→散点图→简单分布→定义→把计划面积放入Y轴;家庭收入放入X轴→确定→查看输出窗口→说明大部分的数据点集中在一定区域中,有少部分数据点“脱离”整体数据较远,家庭收入与计划购买住房面积之间存在一定正的弱相关。 2、根据教材P274“SPSS计算相关系数的基本步骤”,在练习1绘制散点图的基础上,对于案例8-1,练习通过计算相关系数,判定分析家庭收入与打算购买的住房面积之间相关关系的强弱。 分析→相关→双变量→把家庭收入、计划面积放入变量框→确定→查看输出窗口→家庭收入与计划面积的简单相关系数为0.323,存在弱的正相关。P=00.01=α,认为两总体不是零相关。 3、练习教材中P309案例9-1,掌握线性回归分析的基本操作,理解回归参数的普通最小二乘估计的原理,掌握回归方程的拟合优度检验、回归方程显著性检验、回归系数显著性检验、残差分析的基本概念、原理和判断规则。数据文件为“高校科研研究.sav” 分析→回归→线性→把课题总数放入因变量框;把投入人年数、投入高级职称的人数、投入科研事业费、专著数、论文数、获奖数放入自变量框→方法点进入→ 点统计量→ 选共线性诊断→ 继续→确定→查看输出窗口→由于该方程中含有多个变量,所以看调整R方=0.924,拟合优度较高,被解释变量可以被模型解释的部分较多,不能被解释的部分较小。 回归方程的显著性检验:P=0α=0.05应拒绝原假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。回归系数显著性检验:有的Pα=0.05,因此不拒绝原假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应保留在方程中。从容忍度和方程膨胀因子看,投入高级职称的人年数与其他变量的多重共线性很严重,可考虑剔除该变量。第七个特征根既能解释投入人年数方差的84%,也能解释高级职称的人年数方差的98%,还可以解释专著数方差的44%,这些变量存在多重共线性;5,6,7条件指数都大于10。 特征根 条件指数 方差比(比例之和等于1) 1、容忍度 是测量解释变量间多重共线性的重要统计量。容忍度的取值范围在0~1之间,越接近于0表示多重共线性越强;越接近于1表示多重共线性越弱。 2、方差膨胀因子 方差膨胀因子是容忍度的倒数,方差膨胀因子的取值大于等于1。通常,如果膨胀因子大于等于10,说明解释变量xi与方程中其余解释变量之间有严重的多重共线性。 3、特征根和方差比 特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法。最大特征根的值远远大于其他特征根的值,则说明这些解释变量间具有相当多的重叠信息,原因是仅通过这一个特征根就基本刻画出了所有解释变量的绝大部分信息。 解释变量标准化后它的方差为1。如果某个特征根既能够刻画某解释变量方差的较大部分(0.7以上),同时又可以刻画另一根解释变量方差的较大部分,则说明这两个解释变量间存在较强的线性相关关系。 4、条件指数 条件指数反映解释变量间多重共线性的指标。当0=Ki10时,多重共线性较弱;当10=Ki100时,认为多重共线性较强;Ki=100时,认为多重共线性很强。 分析→回归→线性→把课题总数放入因变量框;把投入人年数、投入高级职称的人数、投入科研事业费、专著数、论文数、获奖数放入自变量框→方法点向后→ 点统计量→ 选共线性诊断、残差的Dubin-Watson→ 继续→确定→查看输出窗口 拟合优度的检验:经过六步,完成回归方程的建立,最终为第六个模型。随着解释变量的不断减少,方程的拟合优度下降了。说明建立回归方程并不是一味追求高的拟合优度为唯一目标的,还要重点考察解释变量是否对被解释变量有贡献。方程的DW检验值为1.747,残差存在一定程度的正自相关。(P296) 最终方程为第六个:P=0α=0.05,被解释变量与解释变量间的线性关系显著,建立线性模型是恰当的。 第六个模型:P=0α=0.05,说明投入人年数与被解释变量间的线性关系显著,它保留在模型中是合理的。最终方程是 立项课题数=-94.524+0.492投入人年数 意味着投入人年数每增加一个单位会使立项课题数增加0.492个单位。注:通常情况下,即使常数项在模型中不显著,我们也会在模型中保留,去掉它会对模型带来不利的影响。 变量的剔除过程,在模型三中,剔除专著数的情况下,如果保留投入高级职称的人年数,那

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档