- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
后退法(Backward):与前进法正好相反。先将全部自变量选入方程,然后,根据事先规定的剔除标准,再逐步一个一个地剔除无统计学意义的自变量,直到没有自变量可剔除为止,然后再对剩余的自变量建立新的回归方程。 优点:考虑到自变量的组合作用。善于发现联合作用较强的变量。(沾光) 缺点:当自变量较多或某些自变量间高度相关时,可能得不出正确的结果。只考虑剔除,不再考虑重新进入方程。 (三)回归方程的建立(附:SPSS操作) 逐步法(Stepwise):是前进法和后退法的综合,是双向筛选的一种方法。其本质是前进法,但每引入一个自变量进入方程后,要对方程中每个自变量作检验,看是否有退化为“不显著”的自变量,如有,则剔除出方程,以确保每次引入新变量之前,方程中全部是“显著”作用的自变量。反复进行,直到既无自变量需要引入,也无自变量从方程剔除为止。从而得到一个局部最优的回归方程。 逐步法克服了前进法和后退法的缺点,是一种比较好的方法。 (三)回归方程的建立(附:SPSS操作) (四)多元回归方程的检验 (1)回归方程是否有效 ①方差分析:对整个回归方程的假设检验 ②t检验:分别对截距、偏回归系数进行检验 (2)拟合条件的检验 ①方差齐性检验:用标准化预测值为横轴,以学生化残差为纵轴绘残差图。如果残差的分布无规律,则符合条件,反之,不满足条件。 以下图形系采用SPSS 13.0附带的数据文件:Breast cancer survival.sav Y-Pathologic Tumor Size (cm) X:Age, Histologic Grade,Time ②回归模型残差的正态性检验: ★残差累积概率图(P-P图):如残差在直线周围分布,表示符合要求。 ★残差直方图:在SPSS作回归分析中,选择Histogram即可得到残差的直方图。 轻度偏态 ③残差图示法:残差为纵坐标、估计值y(或某个自变量xi)为横坐标作残差图进行分析。 标准化残差绝对值2 为异常点。 标准化残差 标准化预测值 异常点 残差图:绝大部分的观测值随机地落在±2范围内,预测值与学生化残差之间无明显关系,回归方程满足线性和方差齐性要求。 结束 The end 1/ 利用判别指标判断影响点: ①SDRESID(学生删除残差):学生删除残差/它的标准误2,该点可能是影响点。 ②COOk距离:一个被认为是影响点的观察值被删除后,其他所有观察值残差的变化。此值越大,表示这个被认为是影响点的观察值的影响力越大。 ③Mahalanobis距离(马氏距离):观察值与自变量平均值之间的距离,用于回归方程中只有一个自变量的情况。距离越大,影响越大。 三、影响分析的指标 ④Leverage Value(中心点杠杆值):其取值范围:0~(N-1)/N。其值越大,越有影响力。等于0,说明此观察值对回归方程无影响;杠杆值为(N-1)/N,说明此观察值对回归方程的贡献很大。理论上希望所有的观察值的杠杆值都接近于p/N(p为方程中自变量的个数)。当杠杆值2p/N时,说明此观察值的影响力很大。 ⑤Covariance Ratio(协方差比):用来衡量某个观察值是否对回归系数具有显著的影响的指标。当此值接近1时,表明此观察值不是影响点。 判断界值:| cov ratio -1| ≥3p/N (可能是) N为观察值的个数。 三、影响分析的指标 2/利用回归系数的变化进一步检验影响点 重点检查某个观察值在与不在回归方程时回归系数的变化情况。 凡前后变化的标准偏回归系数: 差值 (N为观察值的个数),可认定为影响点。 三、影响分析的指标 3/SPSS软件影响点的查找(1) 3/SPSS软件影响点的查找(2) ★在回归分析的对话框中,点击Save,根据需要选择要保存的选项; ★在数据窗中查找已经保存好的参数。或再进行别的分析,如绘制残差图等。 这些指标保存到数据文件中。 残差 预测值 距离 预测值的可信区间 ⑴DfBeta(s): 设从数据中剔除第i条记录前后回归系数之差值。一般大于 就可怀疑为强影响点。 ⑵ Standardized DfBeta(s): DfBeta(s)的标准化值,一般2, 或 就可以怀疑该记录为强影响点。 ⑶DfFit: 某观察值代入包含和不包含该自变量的回归方程所得之差。 ⑷ Standardized DfFit): DfFit的标准化值 以上指标越大,为强影响点的可能性就越大 三、影响分析的指标 ⑸Covariance ratio(协方差比):当此值接近1
原创力文档


文档评论(0)