线性回归分析方法.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
9-1 实验报告 1 实验内容与目的 利用线性回归分析方法分析研究高等院校人文社会科学研究中立项课题数受哪些因素影响,并建立回归模型。这里收集了某年31个省市自治区部分高校有关社会科学研究方面的数据,其中,被解释变量为立项课题数,解释变量为投入人年数、投入高级职称的人年数、投入科研事业费、专著数、论文数、获奖数,分别采用了强制进入策略和向后筛选策略。 操作过程 (包含的主要内容①数据文件的建立②分析前数据的预处理③统计分析运用方法操作) 数据文件的建立:将“课题总数”,“投入人年数”“投入高级职称的人年数”“投入科研事业费”“专著数”“论文数”“获奖数”设为标准型变量,定计量尺度为定距型数据。 1 analyze-regression-linear 2将“课题总数”选入dependent,“投入人年数”“投入高级职称的人年数”“投入科研事业费”“专著数”“论文数”“获奖数”选入independent 3 打开method的下拉框 选择一 选择enter,点statistics勾选estimates model fit collinearity diagnostics (可以得到图1至图4) 选择二 选择backward, 点statistics勾选“estimates” “model fit” “r squared change” “descriptives” “Collinearity ” 点save 在predicted框中勾选 “standardized” “adjusted ” “s.e.of mean predictions” 点save 在 residuals 框中勾选 “standardized” “studentized”“studentized deleted ” 点save 在 influence框中勾选 “dfbeta(s)”“ dffit”“covariance” (可以得到图5至图8) 4 点击plots按钮,将“zresid”选入y,将“zpred”选入x,勾选nomal probability plot (可以得到图10和图12) 5 analyze-nonparametric-1-sample k-c tests 6 将standardized residual 选入 test variable list ,选择test distribution框中的nomal (可以得到图9) 7 analyze-correlate-bivariate 8 standardized residual和 standardized predicted选入variable 再勾选speamam (可以得到图11) 结论与分析 (对输出结果进行解释说明) 从图1可以看出,进行拟合优度检验,R2=0.969,由于方程有多个解释变量,可参考可调整的判定系数,可调整的判定系数为0.924,比较接近1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,不能被解释的部分较少。 从图2可以看出,表二显示了被解释变量的变差来源、自由度、方差和离差平方和等,可以看出,被解释变量的总离差平方和为2.1×107,回归平方和及方差分别为2×107和3298385.48,剩余平方和及方差分别为1286497和53604.047,F检验统计量的观测值为61.532,对应的概率P-值接近0。依据该表可进行回归方程的显著性检验,如果显著性水平为0.05,由于P-值小于显著性水平,应拒绝回归方程显著性的原假设,认为各回归系数不同时为0,被解释变量和解释变量全体的线性关系是显著的,可以建立线性回归模型。 从图3可以看出,图3显示了偏回归系数、偏回归系数的标准差、标准化偏回归系数、t检验的统计值和方程的膨胀因子等。依据该表可以进行回归系数的显著性检验,可以看到:如果显著性水平α为0.05,除投入人年数以外,其他变量的回归系数显著性t检验的概率P-值都大于显著性水平α,因此不应该拒绝原假设,认为这些偏回归系数与0无显著性差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。由于模型中保留了一些不该保留的变量,因此该模型目前是不可用的,应该重新建立模型。同时,从容忍度和膨胀因子来看,投入高级职称的人年数与其他解释变量的多重共线性很严重,在重新建立模型时可以考虑删除该变量。 从图4可以看出,图4显示了特征值、条件指数、各特征值解释各解释变量的方差比。依据该表可进行多重共线性检验。从方差比来看,第七个特征值既能解释投入人年数方差的84%,也可以解释投入高级职称的人年数方差的98%,同时还可以解释专著数方差的44%,因此有理由认为,这些变量间存在多重共线性。从条

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档