医学统计学 10第十讲 线性相关.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学 10第十讲 线性相关

第十二章 直线相关 世间万物是普遍联系的 医学上,许多现象之间也都有相互联系,例如:身高与体重、体温与脉搏、年龄与血压、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。 相关关系 当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。 相关关系不一定是因果关系。 第一节 直线相关 (linear correlation) 主要内容 一、散点图 二、相关系数 三、相关注意事项 一、散点图 为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。 作法:为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 作用:粗略地给出了两个变量的关联类型与程度 相关类型: 二、相关系数 相关系数(correlation coefficient)是衡量两个连续变量之间关联的强度的指标,样本的相关系数用r 表示,总体的相关系数用ρ表示。 相关系数取值: -1r1 相关系数的性质 -1 ≤ r ≤ 1 r>0为正相关 r<0为负相关 r=0为零相关或无相关 Pearson相关系数的计算 离均差平方和、离均差积和的展开 例13-1 测得某地15名正常成年人的血铅X和24小时的尿铅Y,试分析血铅与24小时尿铅之间是否直线相关。 ∑X=3.00 ∑Y=3.17 ∑ X2=0.7168 ∑Y2=0.7681 ∑XY=0.7388 n=15 =0.9787 相关系数的假设检验 上例中的相关系数r等于0.9787,说明了15例样本中血铅与尿铅之间存在相关关系。但是,这15例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数(?)为零时,由于抽样误差,从总体抽出的15例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数?=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。 相关系数的假设检验 查表法 当n≤50,v=n-2,查r界值表,得到P值 t检验法 计算检验统计量tr,查t界值表,得到P值 例题 H0 : ?=0 无关 H1 : ?≠0 相关 ?=0.05 r=0.9787, n=15, 代入公式 v=15-2=13,查t界值表,P0.001,拒绝H0,认为血铅与尿铅之间有正相关关系。 总体相关系数的区间估计 三、相关注意事项 线性相关的前提条件是X、Y都服从正态分布(双变量正态分布) 当散点图有线性趋势时,才可进行线性相关分析 必须在假设检验认为相关的前提下才能以r的大小判断相关程度 相关关系并不一定是因果关系,有可能是伴随关系 第二节 秩相关 (rank correlation) 应用条件 不服从双变量正态分布、总体分布型未知、等级变量 Spearman等级相关 将各变量X,Y分别编秩p,q; 计算p与q的Pearson相关; 所得结果即为Spearman等级相关rS。 -1≤rs≤1 秩相关系数的检验 查rS界值表 小结 对服从正态分布的两连续性变量,若有一份随机样本,计算Pearson相关系数。 对不服从正态分布的两连续性变量或等级变量,若有一份随机样本,计算Spearman秩相关系数。 对于两个反映属性的分类变量,若有一份随机样本,可作交叉分类表,进行独立性的χ2检验和列联系数来描述关联程度。 习题 1.相关分析一般是研究( ) A.两份随机样本的两个相同指标的相互关系 B.两份随机样本的两个相同指标间的差别 C.两份随机样本的两个不同指标的相互关系 D.一份随机样本的两个相同指标的相互关系 E.一份随机样本的两个不同指标的相互关系 2.相关系数反映了两变量间的( ) A.依存关系 B.函数关系 C.比例关系 D.相关关系 E.因果关系 * * X 的离均差平方和: Y 的离均差平方和: X与Y 间的离均差积和: 15名自愿者的血铅和24小时尿铅测量值(μmol/L) 0.24 0.22 15 0.

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档