- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
若 F ≥ Fα(m,n – m – 1)则在 α 水平上拒绝 H0 ,认为总体复相关系数 ρ 不为0;否则不拒绝 H0 ,认为总体复相关系数 ρ 为0。 例如,在例1中,可求得应变量与三个自变量之间的复相关系数: …… …… (16) 查表可得 F0.01(3,29)=4.54,故在α=0.01 水平上拒绝原假设H0 ,表明总体复相关系数 ρ 不为0,可以认为体重( X1)、心脏纵径(X2)、胸腔横径(X3 )与心脏面积(Y )之间存在线性相关性。 这里,我们引入一个重要的统计量 R2称为决定系数(coefficient of determination)或相关指数,它反映了回归平方和U 在总变异 lyy 中所占的比例。显然, R2 愈大,则 U 亦愈大,说明回归效果愈好。从这个意义上讲,相关与回归是可以相互解释的。 …… …… (17) 另一方面,可以证明,复相关系数的F检验统计量 与多元线性回归方程的检验统计量 是相等的,这就是说,对复相关系数的检验等价于对回归方程的检验。在例1中,分别用上述两式求得的 F 值分别为61.151与61.149,略有差异,这是计算误差所致。 2. 偏相关系数 复相关系数解决了一个变量与其余所有变量之间的线性相关关系。下面讨论在多个变量同时存在的情况下,任意两个变量之间的相关关系。 在只有两个变量(X、Y)的情形,其相关系数为: 一般说来,在多个变量X1,X2 ,…… , Xm同时存在的情形, 任意两个变量Xi,Xj 之间的简单相关系数 rij 就不能正确地反映它们之间的线性相关性了,这是因为有其它变量的干扰存在。为了正确地反映Xi与Xj 之间的相关性,需要消除其余变量的影响。 由偏回归平方和Ui 的定义可知,Ui 的大小反映了在消除其余自变量影响后, Xi对 Y 在线性意义下的影响。因此,称 为 Xi 与 Y 的偏相关系数。 riY? 的符号与偏回归系数bi 的符号一致。其中: Ui 为偏回归平方和; Qi(m-1)为去掉 Xi 后, Y对其余 m - 1个自变量作线性回归时的剩余平方和。 …… …… (18) 可以证明,当 Qi(m-1) ≠ 0 时, riY? 有如下性质: 关于性质(3),有 lyy=U + Q 全部自变量与Y作线性回归 lyy=Ui (m -1)+ Qi (m -1) 去掉Xi后,其余m-1个自变 量与Y作线性回归 当|riY?|=1,即Ui = Qi (m -1)时,有 lyy=Ui (m -1)+ Qi (m -1) = Ui (m -1)+ Ui = U 于是得 Q = 0 性质(3)说明: Xi 与 Y 的偏相关系数 riY? 取值为 +1或-1时,等价于剩余平方和 Q 为零。 即此时若把 Xi 加入回归方程,则 Y与全体自变量呈最理想的线性关系,而不管缺少 Xi 时的回归方程是否有统计学意义。 这实际上表明,当 riY? 取值为 +1或-1时, Xi 与 Y 之间呈最理想的线性关系。 一般地说, riY? 的绝对值愈接近于1,则 Xi与 Y 的线性关系愈密切,但riY? 的绝对值与1究竟接近到什么程度才能认为这种线性关系具有统计学意义呢?这需要进行假设检验。 这里,检验假设为总体偏相关系数ρiY? =0,即 H0: ρiY? =0 检验统计量为: 或: 至于任意两个变量 Xi 与 Xj 之间的偏相关系数 ,只需将Xi 与 Xj 中任意一个视为应变量即可。 …… (19) …… …… (20) 需要指出的是,偏相关系数的计算比较复杂,通常是利用统计软件来解决这一问题的。由SAS软件算得例1的各偏相关系数及相应的p值为: -、回归变量筛选的意义 要注意各自变量的专业背景----不要遗漏 要考虑各自变量相互之间的影响--不要重叠(多元共线性) 如果多元线性回归方程中,相互影响的自变量太多,不仅导致计算量增大,而且也会使回归方程的参数估计和预测精度降低。 二、回归变量的筛选方法 从统计学的角度讲,自变量的选择方法可分为两大类: 全局择优法:以数据对回归模型的拟合优劣为准则 局部择优法:根据自变量对应变量的影响程度大小为准则 全局择优法:
文档评论(0)