医学统计学回归系数的假设检验.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三节回归系数的假设检验 建立样本直线回归方程,只是完成 了统计分析中两变量关系的统计描述, 研究者还须回答它所来自的总体的直线 回归关系是否确实存在,即是否对总体 有 Q h 0 ? 回归系数的方差分析 理解回归中方差分析的基本思想, 需要对应变量F的离均差平方和仏作分 角乍如图12—-I所示. 任意一点P的纵坐标被回归直线P与均数歹截 成三个线段,其中: Y-Y = (Y-Y) +(Y-Y) a 由于 P 点 是散点图中任取的一点,将全部数据点都按上法处 理,并将等式两端平方后再求和则有 V(y_F)2 = V(y_f)2 + V(F-F)2 数理统计可证明: 上式用符号表示为 SS总二SS回+ SS残 式中 SS总即Y (Y -『)2 ,为厂的离均差平方 和,表示未考虑X与卩的回归关系时T的 ¥刁花曰 心、乂 ° 辭回 即V(F-F)2 ,为回归平方和。由于特定样本的 均黏I7是固定的,所以这部分变异由£的大小不同引起。 当X被引入回归以后,正是由于兀的不同导致了 Y^a+bX,不同,所以SS回反映了在Y的总变异中可以用 X与F的直线关系解释的那部分变异。 〃离0越远,X对F的影响越大,昭回就越大*说明 回归效呆越好: S3残即丫(F-汙,为残差平方和.它反应除了工对 『的线性影响之外的一切因素对F的变异的作用,也就 是在总平方和中无法用工解释的部分,表示考虑回归 之后y真正的随机误差.在散点图中,各实测点离回归 直线越近,ss残也就越小,说明直线回归的估计误差越 卜回归的作用越明显. 上述三个平方和,各有其相应的自由度”,并有如下的关系: 以上分解可见,不考虑回归时,随机误 差是Y的总变异S3、;而考虑回归以后,由 于回归的贡献使原来的随机误差减小为SS残o 如果两变量间总体回归关系确实存在,回 归的贡献就要大于随机误差,大到何种程度 时可以认为具有统计意义, 可计算统计量F: 二MS回 S残 「回=1, ?殘=—2 式中 站S回为回归均方 MS残为残差均方 F服从自由度为回、 F服从自由度为回、 卩残的尸分布。 2. t检验 对P-o这一假设是否成立还可进行如下『检验 例12-3 (续例12-1)根据表12」 数据进行回归系数的方差分析。 解:先列岀下列计算结果 SS 回=blXYXX2681.62 SS 回=bl XY XX 2681.62 41389.4 = 173.7 SS 剩=?总一据回=193.3 — 173.7 = 19.6 p _ p _ ?回?『回 .—幅/卩 E 空—.6 19.6/10 方差分析的基本步骤: (1)检验假设 Hq : 0=0(体重的增加量与进食量之间无直线关系); 呦:0 H 0 (体重的增加量与进食量之间有直线关系); 67=0.05 (2)计算统计量.见方差分析表 表 12-2 方差分析表 变异来源 SS I)F MS F P 回归 173.7 1 173.70 88.6 0.001 剰余 19.6 10 1.96 总变异 193.3 U 确定P值口查F界值表,P0.0013 下结论.按a = 0.05水准,拒绝ho,接受hi, 故可以认为体重的增加量与进食量之间有直线关系. /检验方法 前已算得: 77 = 12 SS^ =19.6 G 二 41389.4 b = 0.0648 厂— 二 0.00688 V41389.4 0.0648 0.00688 二 942 # = 12 — 2 = 10 第四节回归方程可信区间与预测 亠、总体回归系数的区间估计 b = 0.0648 e-:/2小;』+:/2,局) v = n-2 例12-5 (续例12?1)试估计总休 冋归系数的95%的对信区间。 = 0.00688 r005/210 = 2.228 (0.0648 - 2.228 x 0.00688,0.0648+ 2.228 x 0.00688) = (0.0495,0.0801) 二、/zf的区间估计 ? “F是指总体中当X为一定值时的均数。 是波动的,当把%代入回归方程所求 得的估计值,为样本条件均数(condition mean),对总体竹的估计可计算可信 区间,其标准误可按公式计算。 1 * (叫-灭丫 对一已知的自变量值%按回归方程求出预测值扌,再 按下式求出此条件下100 (I- a) %的可信区间n X) ~^a /2,n-2^Y() 例12-6 (续例12-1)根据例12-2所求直线回归方程,试计 算当=250时々95%的可信区间口 7=2.00 + 0.0648^ S” =1.4()x S” =1.4() xQ = 250 7 = 2.00 + (10648x250 = 18.2 (250-24649)241389.4=0.405 (250-2

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档