10章两变量关联性分析2013.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10章两变量关联性分析2013.ppt

第一节 直线相关 直线相关(linear correlation)又称为简单相关(simple correlation),用于研究两个连续性随机变量X和Y之间的线性关系。 为了直观地说明两相关变量的线性依存关系,用表10-1第(2)、(3)列中14名中年健康妇女的基础代谢(kj/d)与体重(KG)的数据在坐标纸上描点,得图11-1所示的散点图(scatter plot)。 相关的类型 ★正相关 ★负相关 ★完全正相关 ★完全负相关 ★称零相关 二、相关系数的意义及计算 样本的相关系数用r (correlation coefficient) 相关系数r的值在-1和1之间,但可以是此范围内的任何值。正相关时,r值在0和1之间,散点云图是斜向上的,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,散点云图是斜向下的,此时一个变量增加,另一个变量将减少。r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。 计算例10-1的相关系数 第二节 秩相关 适用条件: 1、不服从双变量正态分布 2、总体分布型未知 3、原始数据用等级表示的资料 一、Spearman等级相关 基本思想:观察值 秩 相关系数 计算公式: 总体等级相关系数?s的检验 1、n≤50时,用查表法(附表14) 2、n>50时, 1、假设: H0:?s=0 H1: ?s≠0 ?=0.05 2、计算检验统计量 对应奥美拉唑组样本观察值为64和21,构成一个频率分布; 对应雷尼替丁组样本观察值为51和33,构成一个频率分布; 问题:两个样本分布的总体分布是否相等,或两样本是否来自同一总体。 H0:两种药物治疗消化道溃疡的愈合率相同。 即相当于两样本分布的总体分布相等。总体分布未知,用两样本联合计算的频率分布作为总体分布的近似。 属性Y1的理论频率近似地等于m1/n 属性Y2的理论频率近似地等于m2/n 那么各个格子的理论频数分别为: 那么每个格子的理论频数分别为: 关联系数 案例分析(相关) 假设检验的步骤: 1)提出检验假设, H0:两种属性相互独立 H1:两种属性相互关联 ?=0.05,双侧概率 2)计算统计量 合计 艾滋病知晓程度 大学生专业 500 450 50 合计 378 359 19 其它 122 91 31 医科专业 低 高 4) 计算 Ф(Phi coefficient): 统计学推论:大学生专业与艾滋病知晓程度有轻度关联性. 确定P值和统计学判断: ∵ χ2(1)=3.84<42.58, ∴P<0.05, 在α=0.05水平上拒绝无效假设 二、配对2×2表资料的关联性分析 132 21 111 合计 42 11 31 阴性 90 10 80 阳性 合计 阴性 阳性 乙培养基 甲培养基 例10-8 表10-5 两种检验方法的结果 问题:两种检验方法的结果是否存在关联? 1. 建立检验假设,确定检验水平 H0:培养基与结果间独立 H1:培养基与结果间不独立 ?=0.05,双侧概率 2. 计算统计量 3.两种检验方法的结果存在关联性 三、多组多分类的R×C表资料的关联性分析 310 26 132 152 合计 52 10 22 20 公交车司机 126 12 62 52 工厂工人 132 4 48 80 机关班干部 胃溃疡 慢性胃炎 浅表性胃炎 合计 胃病 职业 例10-9 表10-6 310名胃病患者按胃病类型与职业两种属性的交叉分类 资料特点:三个组是独立设计。 问题:胃病类型与职业类型之间是否有关? 1. 建立检验假设,确定检验水平 H0:胃病类型与职业类型之间独立 H1:胃病类型与职业类型之间不独立 ?=0.05,双侧概率 2. 计算检验统计量 ,作假设检验。用(9-10)式作卡方检验 3.结论:胃病类型与职业类型之间有关联 335 150 100 85 O型(i=1) 1043 (N) 446 335 262 合计 54 6 25 23 AB型(i=4) 400 170 132 98 B型(i=3) 254 120 78 56 A型(i=2) MN型(j=3) N型(j=2) M型(j=1) 合计 MN血型(j) ABO血型 (i) 例11-9 表11-7 某地1043居民的ABO血型与MN血型的交叉分类(4×3列联表资料) 1. 建立检验假设,确定检验水平 H0:两种

文档评论(0)

docinppt + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档