第九章 双变量回归与相关课件.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 强调:任何对于回归系数的“因果关系”的判断都必须基于回归分析以外的理论。 * SY=3.38 * 上述四个数据集已被设计得出相同的标准线性回归结果:斜率、截距、相关系数、回归标准误以及统计检验结果。但非常重要的是,它们不具有相同的残差。(a)正常线性回归; (b)非线性; (c)奇异点; (d)强影响点。 * 。 (3)控制: 指当要求因变量Y在一定范围内波动时,如何控制自变量X的取值。 例 :已知血糖正常范围为(4.44~6.66 mmol/L),在例6.1资料的基础上,问欲将血糖水平控制在正常范围内时,血中胰岛素应维持在什么范围内? (?=0.05) 解得:X( 33.95, 38.79)mU/L (4)利用回归方程获得精度更高的参考值范围 P 0.001 当年龄为50岁时 95%参考值范围 (3.89, 5.22) 精度显著提高 各年龄胆固醇95%参考值范围 (3.26, 5.85) 1)应有实际意义; 2)分析前应绘制散点图; 3)应在实际回归范围内应用; 4)要假设检验,且结论不能绝对化。 (5)应用直线回归时注意事项: 某地有风俗,每当小孩出生,均在自家庭院中种上一棵树,随着树的生长,小孩也在长高。你认为两者是什么关系? 伴随关系 正常线性回归 非线性 奇异点 强影响点 上述四个数据集有相同的标准线性回归结果:斜率、截距、相关系数、回归标准误以及统计检验结果。 但残差不同 关于回归诊断 回归模型仅仅是人们对现实世界的一种数学猜想,事实上,是先有“型”,后有“模”,所有的模型都是近似的,模型适当与否,得由是否符合实际情况来判断。 回归诊断是用于探索存在于回归分析中的问题及判断某些假设是否合理的一种技术。 二、直线相关 1. 相关系数(?, r) 概念 表示两变量直线相关的密切程度和方向。 相关系数波动范围: -1 ? r ? 1 (1)密切程度: |r| ? 1,相关越密切; |r| ? 0,相关越弱。 r=1或 -1,称完全相关; r=0, 称零相关,表示不存在直线相关关系,但不排除存在某种曲线关系的可能性。 (2)方向: r 0, 正相关; r 0, 负相关。 2. 相关系数的计算步骤 (1)绘制散点图观察两变量见是否呈直线趋势; 20名糖尿病人的血糖水平与胰岛素水平的散点图 H0: 正态分布 H1: 非正态分布 ? = 0.10 正态 (2) x,y是否服从正态分布 (3)计算相关系数 计算例6.1资料的相关系数 3. 相关系数的假设检验(t 检验) 例6.1资料: H0: ? = 0 ; H1: ? ≠ 0;?=0.05 查表得:P 0.01 (结果同回归系数检验) 三、直线相关、回归的区别与联系 1. 区别: (1)在资料要求上不同; 回归: 要求Y服从正态分布,X是可以精确测量或严格控制 的。此类回归一般称Ⅰ型回归。 相关:要求X、Y均服从正态分布(双变量正态分布)。此类资料进行回归分析,称II 型回归。 (2)在应用上不同。 回归:反映两变量间依存变化的数量关系; 相关:反映两变量间相关的密切程度和方向。 2. 联系 (1)同一组资料,r 与 b符号(正负号)一致; (注意:两者大小有一定关系,但不绝对) (2)同一组资料, r 与 b的假设检验是等价的,即tb = tr (3)可用回归解释相关 r2 称为确定系数,其意义为回归变异占总变异的比值。 例如:某一资料 r = 0.20 ,n = 100,求得 t =2.021,P 0.05 但 r2 = (0.20)2 =0.04, 表示回归变异在总变异中仅占4%,说明两变量间的相关关系实际意义不大。 四、秩相关(等级相关) 1. 适用于下列资料: (1)不服从双变量正态分布的资料;(如二项分布) (2)总体分布型未知; (3)原始数据是用等级表示。 2. 秩相关系数(rs)意义 不用原始数据计算,而是根据数值大小的秩次进行计算。其意义同直线相关系数。 3. 秩相关系数的计算 (1)按直线相关系数公式计算,只是用秩次代替原始观察值。 (2)Sperman公式法: 例6.2 为研究饮水中氟含量与氟中毒患病率之间的关系,测定了9个居民点井水中的氟含量X(mg/L),并同时通过体检得到这些居民点中常住居民的氟中毒患

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档