10-统计学直线相关与回归.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10-统计学直线相关与回归

在医学科学研究中,常要分析变量间的关系,如身高与体重、年龄与血压、体温与脉搏、糖尿病患者的血糖与胰岛素水平、药物剂量与疗效等,相关与回归(correlation and regression)分析方法就是研究这种关系的统计方法。本章只介绍相关与回归分析中最简单、最基本的两个变量间呈直线关系的分析方法。 1.掌握直线相关与直线回归的概念、直线回归方程的求法及检验。 2.熟悉相关系数的意义、计算及检验方法。 3.了解相关与回归的区别与联系;直线回归方程的应用及其注意事项。 相关(correlation)指一个变量增大,另一个变量也随之增大/减少的共变现象。两个变量有共变现象时称为有相关关系。 直线相关(linear correlation)又称简单相关(simple correlation)是用于判断两个变量之间有无直线相关关系,并回答相关的方向和相关程度如何的统计分析方法。 相关系数是说明具有直线关系的两个变量间相关关系的密切程度与相关方向的指标,符号为r。相关系数没有测量单位,其数值为-1≤r ≤1。 r值为正,表示正相关; r值为负,表示负相关; r值为0,则称零相关。 х与У是两个随机变量; 散点图呈线性关系; 变量均服从正态分布。 【例10-1】某研究所研究某种代乳粉的营养价值,用10只大白鼠得到大白鼠进食量(g)和增加体重(g)的数据(表10-1)。大白鼠进食量与体重增加量之间是否存在相关关系? ⑴线性相关表示两个变量之间的关系是双向的,当散点图出现直线趋势时再作分析。 ⑵相关系数的计算只适用于两个变量都服从正态分布的资料。 ⑶样本相关系数是总体相关系数ρ的一个估计值,与ρ之间存在着抽样误差,必须作假设检验。 ⑷相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系。 变量y与x之间存在直线关系时,不仅可以用相关系数表示y与x线性关系的密切程度,也可以用一个直线方程y=a+bx来表示y与x的线性关系。以一个直线方程来描述两个变量间依存变化的近似的线性数量关系——直线回归关系,由此得出的直线方程叫做直线回归方程(linear regression equation)。 线性(Linearity) 独立性(Independency) 正态性(Normal distribution) 等方差性(Equal variance) 绘制散点图 考察资料是否满足直线回归分析的条件 计算回归系数b和常数项a 建立直线回归方程 对回归方程及回归系数进行假设检验 【例10-2】表10-2给出了12名不同年龄(岁)妇女的收缩压测量值(mmHg),试作直线回归分析。 ⑴作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象间的内在联系有所认识。 ⑵在进行直线回归分析之前,应绘制散点图,当观测点的分布有直线趋势时,才适宜作直线回归分析,如散点图明显呈曲线趋势,使之直线化再行分析。 ⑶直线回归方程的适用范围一般以自变量的取值范围为限,在此范围内求出的估计值,一般称为内插。超过自变量取值范围所计算的值称为外延。若无充分理由证明超过自变量取值范围之外还是直线,应该避免外延。 直线相关与回归的区别与联系 ⑴相关分析反映应变量与自变量 间的互依关系,任何一个的变化都会引起另一个的变化,是一种双向变化的关系;回归分析体现应变量随自变量变化而变化的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。 ⑵相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。 ⑶直线相关分析只适用于x、y服从双变量正态分布资料。直线回归即适用于y服从正态分布,x是可以精确测量和严格控制的变量(Ⅰ型回归模型);也适用于x、y服从双变量正态分布资料,可以计算两个回归方程(Ⅱ型回归模型)。 ⑷r与b的绝对值没有直线联系,b有单位,而r无单位。 ⑸两事物或现象间存在相关关系,不一定是因果关系,可能只是伴随关系,而一旦两事物或现象间存在因果关系,则必然相关。 ⑴对一组数据若同时计算r与b,它们的正负号是一致的。r为正号说明两变量间的相互关系是同向变化的。b为正,说明增(减)一个单位,平均增(或减)b个单位 ⑵r和b的假设检验是等价的,即对同一样本,二者的t值相等。可以简单的的假设检验代替对的假设检验。 ⑶相关回归可以互相解释。的平方称为确定系数(coefficient determination)。 一、统计学方法选择的原则 2.根据变量的类型选择分析方法 分析目的 设计方案 资料类型 分析方法适用条件 * * * * *

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档