第十章 两变量相关性分析.pptVIP

  • 37
  • 0
  • 约2.88千字
  • 约 50页
  • 2021-08-19 发布于陕西
  • 举报
四、简单相关系数的假设检验 r≠0的原因:① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠0 常用的相关系数假设检验方法有两种: 1. 查表法 (n50) 按自由度v=n-2查相关系数界值表(附表12,P425)。 2. t 检验 (n50) 公式 ,υ=n-2 Sr---- 相关系数的标准误 求得 t 值后查t 界值表得P值。 本例n=21,故采用查表法:按v= n-2 = 21-2 = 19 查附表12可知, 本例 r= 0.486 ,故 P0.05, 按 水准,拒绝H0,接受H1。说明肝癌病人血清胆固醇与三酰甘油有线性正相关。 采用t检验方法对例10-1分析进行分析: 本例也可采用t检验方法进行分析。 与直接查r界值表的结论一致。 五、线性相关分析的注意事项 线性相关分析前应作散点图,以判断两变量间有无线性变化趋势。 线性相关分析满足双变量正态分布条件。 出现异常值时慎用相关。 相关关系未必是因果关系。 分层资料盲目合并易出现假象。 第二节 秩相关 当资料不满足双变量正态时,需采用非参数统计方法---秩相关(等级相关)来分析两变量之间的关系。其中常用的方法为Spearman等级相关。 秩相关(等级相关)是对双变量计量或等级资料进行相关分析的方法。由于这类方法对原变量分布不作要求,故为非参数检验方法。 等级相关的适用资料: ⑴ 不服从双变量正态分布; ⑵ 总体分布类型未知或开口资料(如X 0.001); ⑶ 原始数据用等级表示. ? 与积差相关类似,它是用等级相关系数rs (即 Spearman Correlation Coefficient)来说明两个变 量间直线相关关系的密切程度与方向。 ? rs值界于-1与1之间,rs为正表示正相关,rs为负 表示负相关,rs等于零为零相关。 ? 样本等级相关系数rs是总体等级相关系数的估计值。 一、 Spearman相关系数 二、 秩相关基本思想 三、等级相关系数的计算 该式适用于资料中取相同秩次不多的情况。 当相同秩次较多时,采用以下校正公式: 其中 , t为X或Y中相同秩次的个数。 常用的假设检验方法有两种: 1. 查表法 当n50时,按样本量n的大小查等级相关系数界值 表(附表13,P426)。 2. u 检验 当n50时,计算u统计量。 四、等级相关系数的假设检验 例10-2 为了研究肝癌病人分期与血清甲胎蛋白水平(AFP)之间的相关关系,某研究人员收集了10例肝癌病人的数据,结果见表10-2。问:肝癌病人分期与血清AFP是否有相关关系? 五、实例分析 表10-2 肝癌病人分期与AFP(ng/mL)相关关系研究 序号 1 2 3 4 5 6 7 8 9 10 分期 IV III IV IV I II II I III III AFP 9402.0 2134.8 12905.0 45354.0 11.2 2.6 313.0 173.1 4411.0 2532.0 表10-2 肝癌病人分期与AFP(ng/mL)相关关系研究 在医学研究中,经常需要研究两个变量之间的相互关系和相互依存关系,如血糖与胰岛素水平、年龄与血压等,把这种统计分析方法叫做双变量关系的统计。 回归 ---- 变量间在数量上的依存关系 相关 ---- 变量间在数量上的相互关系 从数学关系上讲,两变量之间的关系包括线性 关系和曲线关系(非线性关系)。 一般而言,用X表示自变量(代表原因),用Y 表示因(应)变量(代表结果)。 第一节 简单线性相关 简单线性相关:又称为直线相关(linear correlation),用于描述双变量正态分布资料。 两变量间的相关关系大小用Pearson相关系数 (correlation coefficient)来描述。 相关系数(correlation coefficient),又称积差相关系数,或 Pearson 相关系数(软件中常用此名称),是用来定量描述两个变量间线性相关关系的密切程度与相关方向的统计指标。 r ——样本相关系数;ρ ——总体相关系数。 一、相关系数的概念 二、相关系数的计算 式中 为X的离均差平方和, 用 代替; 为 的离均差平方和,用 代替; 为 与 的离均差乘积之和,用 代替;此值可正可负,从而 决定r 的符号。 r 绝对值大小表示两变量间的密切程度。 r 的正负号表示两变量间的方向。 相关系数r 没有单位,其取

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档