网站大量收购独家精品文档,联系QQ:2885784924

11 关联分析整理.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
11 关联分析整理

第11章 两变量关联性分析 2012.10.15 第一节 线性相关 线性相关的概念及其统计描述 ; 相关系数的统计推断 ; 线性相关应用中应注意的问题 。 一、线性相关的概念及其统计描述 例11-1 随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如表11-1所示。据此数据如何判断这两项指标间有否相关? 相关系数: Pearson积差相关系数(correlation coefficient)是人们定量地描述线性相关程度的一个常用指标, 其定义为: 当上式右端分别为总体协方差和总体方差时, 左端便是总体相关系数, 习惯上记为ρ。若ρ≠0, 称为X和Y线性相关, 简称相关; 若ρ=0, 则简称为X和Y不相关。 当上式右端分别为样本协方差和样本方差时, 左端便是样本相关系数, 习惯上记为r。 相关系数的特点有: 1. 相关系数r是一个无量纲的数值,且-1<r<1; 2. r>0为正相关,r<0为负相关; 3. |r|越接近于1,说明相关性越好(密切), |r|越接近于0,说明相关性越差。 二.相关系数的统计推断 H0:ρ=0 H1:ρ≠0 α=0.05 方法一: 直接查r临界值表,根据自由度ν=n-2,查r临界值表,比较|r|与临界值. 例:ν=15-2=13,查r临界值表可得 r0.05(13)=0.514, r0.001(13)=0.760,P<0.001, 即:相关系数有统计学意义,凝血酶浓度与凝血时间之间的确存在线性相关。 方法二: 采用t 检验。 三.线性相关应用中应注意的问题: 样本的相关系数接近零并不意味着两变量间一定无相关性。 一个变量的数值人为选定时莫作相关(应用条件?) 例如, 为研究药物的剂量-反应关系; 出现异常值时慎用相关 ; 相关未必真有内在联系 ; 分层资料盲目合并易出假象。 第二节 秩相关 1. 秩相关的概念及其统计描述 ; 2. 秩相关系数的统计推断 。 一、秩相关的概念及其统计描述 对那些不服从正态分布的资料,或是总体分布未知的资料,因为难以进行假设检验,所以就不宜用积差相关系数来刻画相关性。此时,可采用秩相关(rank correlation),或称等级相关来刻画两个变量间相关的程度与方向。 Spearman秩相关 例11-4 某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析。 二、 秩相关系数的统计推断 H0:ρs=0, H1:ρs≠0, α=0.05 当n≤50时,可查书后的附表14; 当n≥50时,采用前述的t 检验方法。 第三节 分类变量的关联性分析 对定性变量之间的联系通用的方法是根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联(association)分析,即关于两种属性独立性的 检验。 一、交叉分类2×2表的关联分析 例11-6 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例。对每个个体分别观察腹泻与否和喂养方式两种属性。试分析两种属性的关联性。 独立性(independence)检验: : 两种属性之间互相独立, : 两种属性之间互相关联。α=0.05 Pearson列联系数 (contingency coefficient) 二、2×2配对资料的关联性分析 例11-7 有56份咽喉涂抹标本,把每份标本一分为二, 依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,结果如表11-5,问两种培养基的结果有无关联? 三、R×C表分类资料的关联性分析 例11-8 某地居民主要有三种祖籍,均流行甲状腺肿。为探讨甲状腺肿类型与祖籍是否有关联,现根据居民甲状腺肿筛查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表11-6的资料。问甲状腺肿类型与祖籍间有否关联? 小 结 1. Pearson相关系数:双变量正态分布资料; 2. Spearman秩相关系数:非双变量正态分布; 3. 列联系数:交叉分类的频数表资料的关联性分析; 4. 正确理解相关系数和列联系数的含义; 5. 相关分析的基本步骤。 * * 常见的散点图: 误用相关的几种情况: *

文档评论(0)

chenchena + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档