医学统计学课件:7_双变量回归与相关.ppt

医学统计学课件:7_双变量回归与相关.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 双变量回归与相关 概念: 回归与相关是研究两个或多个变量之间相互关系的一种分析方法。 回归: 是研究变量之间统计依存关系的一种方法。 相关: 是研究随机变量之间相互关系密切程度和方向的方法。 直线相关与回归: 只涉及两个变量,而且分析是否呈直线关系,是回归、相关分析中最简单的一种。又称简单相关和回归。 “回归”起源 “回归”概念是19世纪80年代由英国科学家弗兰西斯.高尔顿(Sir.Francis Galton,1822~1911)在研究父母与子女身高之间关系时提出来的。 他发现同一族群中,子女的平均身高介于其父母的身高和族群的平均身高之间。高个子父亲的儿子的身高有低于其父亲身高的趋势,而矮个子父亲的儿子身高则有高于其父亲的趋势。也就是说,子代的身高有向族群平均身高“回归”的趋势,这就是统计学上“回归”的最初含义。 回归分析 指建立应变量与自变量之间统计依赖关系的模型,用自变量对应变量进行“预测”,使“预测值”尽可能接近应变量的“观测值”。 变量间统计关系 变量间回归统计关系 因果性关系 预测性关系 描述性关系 回归分析基本类型 线性回归 一元回归 非线性回归 多元回归 一、直线回归 1. 直线回归方程 直线回归方程的求法 原理(最小二乘法): 各散点距离回归直线纵向距离平方和为最小而得到直线。 2. 建立直线回归方程的具体步骤 ?X = 346.6, ?Y=217.00, ?X2=6552.16, ?Y2=2517.1014 ? XY=3510.45, n=20, X=17.33, Y=10.85 即推断总体回归系数(?)是否为零 (1)方差分析 4. 直线回归方程的应用 (1)描述两分析变量间的数量依存变化关系 4. 直线回归方程的应用 (2)预测: 1)点预测: 一般把易于测定、控制的变量作为自变量,建立回归方程,然后对难以测定或控制的变量值进行预测。 2)区间预测: 当X是已知时,按一定概率估计应变量值或其均数所在范围 当X为某固定值X0时, 总体均数( )的可信区间 例6.1资料,当 X0= 15 mU/L,求 总体均数的95%可信区间。 个体Y值的预报区间(容许区间) 6.1资料,当X=15,求Y的波动范围(?=0.05) 例 题 某地疾控中心根据10年来乙脑发病率(1/10万,Y)与相应前一年7月份日照时间(小时,X)建立回归方程,将乙脑发病率做平方根反正弦变换,即 求得回归方程 已知今年7月份日照时间X=260小时,试估计明年该地的乙脑发病率(设?=0.05)。 (3)控制: 指当要求因变量Y在一定范围内波动时,如何控制自变量X的取值。 例 :已知血糖正常范围为(4.44~6.66 mmol/L),在例6.1资料的基础上,问欲将血糖水平控制在正常范围内时,血中胰岛素应维持在什么范围内? (?=0.05) (4)利用回归方程获得精度更高的参考值范围 关于回归诊断 回归模型仅仅是人们对现实世界的一种数学猜想,事实上,是先有“型”,后有“模”,所有的模型都是近似的,模型适当与否,得由是否符合实际情况来判断。 回归诊断是用于探索存在于回归分析中的问题及判断某些假设是否合理的一种技术。 二、直线相关 1. 相关系数(?, r) 概念 表示两变量直线相关的密切程度和方向。 相关系数波动范围: -1 ? r ? 1 (1)密切程度: |r| ? 1,相关越密切; |r| ? 0,相关越弱。 r=1或 -1,称完全相关; r=0, 称零相关,表示不存在直线相关关系,但不排除存在某种曲线关系的可能性。 (2)方向: r > 0, 正相关; r< 0, 负相关。 2. 相关系数的计算步骤 (1)绘制散点图观察两变量见是否呈直线趋势; (3)计算相关系数 3. 相关系数的假设检验(t 检验) 三、直线相关、回归的区别与联系 1. 区别: (1)在资料要求上不同; 回归: 要求Y服从正态分布,X是可以精确测量或严格控制 的。此类回归一般称Ⅰ型回归。 (2)在应用上不同。 回归:反映两变量间依存变化的数量关系; 相关:反映两变量间相关的密切程度和方向。 2. 联系 (1)同一组资料,r 与 b符号(正负号)一致

您可能关注的文档

文档评论(0)

学习让人进步 + 关注
实名认证
内容提供者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档