《医学统计学》教学课件-相关与回归.pptVIP

《医学统计学》教学课件-相关与回归.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(二)回归系数的假设检验 图6-5 总体回归系数与样本回归系数示意图 (二)回归系数的假设检验 ? = n - 2 其中Sy.x表示去除X影响后Y的变异大小 t检验法 (三)总体回归系数的可信区间估计    回归系数是总体回归系数的点估计,由于存在抽样误差,需要进行可信区间估计,公式为:   (四)决定系数 决定系数(determining coefficient,R2)就是相关系数的平方r2,是回归平方和在总的离均差平方和中所占的比例,反映因变量的总变异中可用回归关系解释的部分。   0≤R2≤1,R2值越接近于1,表示回归平方和在的总离均差平方和中所占的比重越大,模型对数据的拟合程度越好,表明利用回归方程进行预测也越有意义。反之,R2值越接近于,表示回归平方和在的总离均差平方和中所占的比重越小,模型对数据的拟合程度越差。所以,R2是评价回归效果的一个重要指标。 五、绘制回归直线 可在坐标轴上任意取相距较远且易读的两X值,根据所求直线回归方程算得对应 值,用直线连接两点。应注意的是,回归直线可适当延长,但不应超过的实测值范围;另外,所绘回归直线必然通过( ),据此可判断所绘图形是否正确。 六、残差分析 残差(residual)是因变量值 与根据回归方程求出的预测值 之差,反映回归方程预测而引起的误差,表达式为: 残差分析(residual analysis):通过残差了解数据与回归方程之间的关系,考察资料是否满足独立性、正态性和等方差性,检测有无异常值。 最常用的是标准化残差与标准化残差图。以自变量为横轴,标准化残差为纵坐标,绘制标准化残差图。通常以(-2,2)区间为界限来证实模型的假定条件是否得到满足,判断有无异常值。 七、线性回归方程的应用 1.定量描述两变量之间的线性依存关系。 2.利用回归方程对因变量y进行估计(常用区间估计求当x取定某值时y值的波动范围),即进行预测。 3.利用回归方程进行统计控制。 *   【例6-1】20名糖尿病人的胰岛素水平(mU/L)与血糖水平(mmol/L)的测定值列于表6-1,试进行直线相关分析。 表6-1 20名糖尿病人胰岛素(mU/L)与血糖(mmol/L)测定值 病历号 胰岛素 血糖 病历号 胰岛素 血糖 1 15.2 12.21 11 25.1 6.02 2 16.7 14.54 12 16.4 9.49 3 11.9 12.27 13 22.0 10.16 4 14.0 12.04 14 23.1 8.38 5 19.8 7.88 15 23.2 8.49 6 16.2 11.10 16 25.0 7.71 7 17.0 10.43 17 16.8 11.38 8 10.3 13.32 18 11.2 10.82 9 5.9 19.59 19 13.7 12.49 10 18.7 9.05 20 24.4 9.21 直线回归分析 (1)考察资料是否满足直线回归分析的条件 (2)绘制散点图 (3)求直线回归方程 (4)回归方程的假设检验 (5)回归系数的检验 (6)模型的评价 (7)绘制回归直线 (8)残差分析 (9)模型的应用 八、进行线性回归分析的注意事项 1.只有将有联系的变量进行回归分析才有实际意义。 2.以“因”或以易于测定、较为稳定或变异小者为x。 3.因变量是随机变量,自变量既可以是随机变量,也可以是给定的量。 4.回归方程建立后必须进行假设检验。 5.使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围之外。 区别: 1.资料要求不同:相关要求x、y服从双变量正态分布,回归要求y在给定某个x值时服从正态分布,x是可以精确测量和严格控制的变量。 2.应用上:相关说明相关关系,回归说明依存关系; ????? 3.意义上:r说明具有直线关系的两变量间相互关系的方向与密切程度;b表示x每变化一个单位所导致的y的平均变化量; 4.计算不同: 5.取值范围不同: -1≤r≤1,-∞≤b≤∞; 6.单位:r没有单位,b有单位。 九、线性相关和回归的区别与联系 联系: 1.r与b正负号一致:r为正时,b也为正,表示两变量是正相关,是同向变化。r为负时,b也为负,表示两变量是负相关,是反向变化。????? 2.r与b的假设检验等价: 对同一组资料若同时进行r与b的假设检验,可得到相同的t值,即 tr=tb;可用r的假设检验代替b的假设检验。 3.Ⅱ型回归 4.可用回归解释相关。 *决定系数:即相关系数的平方r2,是回归平方和与总的离均差平方和之比,反映应变量y的总

文档评论(0)

学习让人进步 + 关注
实名认证
文档贡献者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档