关联性分析(二).ppt

  1. 1、本文档共78页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联性分析(二) 三、 两个连续型随机变量间的相关分析 散点图 分析内容; Pearson相关; Spearman秩相关; 相关分析中应注意的问题。 例9-1 表9-1为一项关于儿童健康和发展的研究中10名学龄儿童的身高和体重资料,试对学龄儿童的身高(cm)和体重(kg)进行相关分析。 3.1 散点图 判断两个变量是否具有相关关系最直观的办法是绘制散点图(scatter plot)。 将两变量置于直角坐标轴上,把其中一变量取作 X ,另一个取作 Y ,据此在直角坐标系( X, Y )中标出对应的点来,这样的图形称作散点图。 常见的典型散点图及相关的种类 3.2 相关分析的分析内容 线性相关是两变量间最简单的关系,通常从以下三个方面进行分析: 统计描述; 统计推断; 统计应用 3.2 相关分析的分析内容 线性相关是两变量间最简单的关系,通常从以下三个方面进行分析: 统计描述; X 和Y 有联系吗?是线性、非线性联系?联系的程度以及方向? 统计推断; 统计应用 3.2 相关分析的分析内容 3.2 相关分析的分析内容 线性相关是两变量间最简单的关系,通常从以下三个方面进行分析: 统计描述; 统计推断; 统计应用 如何根据相关系数的大小与方向,结合专业知识对两变量的联系进行解释? 3.3 Pearson相关 两变量分别以X, Y表示,如果X 和Y 均是随机变量,呈双变量正态分布,散点图呈线性趋势,各观察值间相互独立,则可用Pearson积矩相关系数来描述两者之间的关系,简称相关系数。 Pearson积矩相关系数的计算 相关系数的正负 相关系数的正负 相关系数的正负 相关系数的特点有: 1. 相关系数ρ、r是一个无量纲的数值, 且-1<ρ、r<1; 2. ρ >0为正相关, ρ <0为负相关; 3. ρ =0为不相关(无线性相关关系) 4. |ρ |越接近于1,说明相关性越好(密切), | ρ |越接近于0,说明相关性越差。 Pearson积矩相关系数的假设检验 H0:ρ=0 H1:ρ≠0 α=0.05 方法一: 直接查 r 临界值表,根据自由度ν=n-2,查P581,C11,相关系数 r 临界值表,比较|r|与临界值. 例:v =10-2=8,查 r 临界值表可得r0.001/2,8=0.872,P<0.001,即:相关系数与0的差异有统计学意义,学龄儿童身高与体重之间存在线性相关关系。 方法二: 采用 t 检验。 相关系数的置信区间估计 Fisher’s 变换 r z 正态近似 ? 的95%I z 的95%CI Fisher’s 反变换 Pearson积矩相关系数的区间估计 z的置信区间 ?的置信区间 相关系数的区间估计 (1) 将r 变换为 z ; (2) 根据 z 服从正态分布,估计 z 的可信区间; (3) 再将 z 变换回 r。 本例 则z的95%置信区间为: 则ρ的95%置信区间为: 3.4 Spearman秩相关 1. 秩相关的概念及其统计描述 ; 2. 秩相关系数的统计推断 。 秩相关的概念及其统计描述 如果X,Y 不服从双变量正态分布,或是总体分布未知,数据本身有不确定值或为等级资料,不宜用积差相关系数来刻画相关性。此时,可采用秩相关(rank correlation),或称等级相关来刻画两个变量间相关的程度与方向。 例9-2 10名患者参加家庭计划的时间长度(天)和每名患者每天的费用(元)见表9-2。请问参加的时间长度和费用是否相关? 解析: 该资料的特点为,变量时间与费用均不服从正态分布。 Spearman秩相关系数的计算 秩相关的基本思想:将原始数据转换为秩次。将两变量X,Y成对的观察值分别从

文档评论(0)

wxc6688 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档