医学统计学 两变量间相关与回归分析PPT.ppt

医学统计学 两变量间相关与回归分析PPT

两变量间相关与回归分析 对一个变量的每个可能取值,另一个变量都有完全确定的值与之对应,则称这两个变量之间的关系呈现函数关系,称确定性关系。若两变量之间确实存在着某种关系,但这种关系不是一一对应的函数关系,称非确定性关系。 第一节 直线相关 一、直线相关的概念 描述两个变量相互关系最简单的统计方法 就是直线相关分析:两个变量是否有直线相关 关系?如果有直线相关关系,那么它们之间的 关系是正相关还是负相关? 相关程度如何? 散点图 图11-1 两变量相关关系示意图 二、相关系数的定义与计算 相关系数(correlation coefficient)又称为积差相关系数(coefficient of product moment correlation)、皮尔逊相关系数(Pearson’s correlation coefficient)、简单相关系数(simple correlation coefficient)等,以符号r表示样本相关系数,ρ表示总体相关系数。它说明具有直线关系的两个变量,相关关系的密切程度与相关方向的指标。其值为-1≤r≤1。 三、相关分析的步骤 例11-1 某医师测得10名3岁儿童的体表面积(m2)与体重(kg)原始资料见表11-1第2、3栏,试分析三岁儿童体表面积与体重间的相关关系。 计算步骤如下: 1、绘制散点图: 2、相关系数的计算 4、相关系数的假设检验 四、相关分析中应注意的问题 (1) 进行相关分析的资料应有实际意义。 (2)相关系数的计算适用双变量正态分布资料 (3) 进行相关分析前应先绘制散点图。 图11-3 异常点对相关分析的影响 (4)相关关系不完全等同于因果关系。 (5)实际工作中计算出的相关系数仅是样本 相关系数 (6)不要把相关系数的假设检验结果误认为 两事物或现象间相关的密切程度。 (7)要注意资料的同质性。 图11-4 样本来自不同总体时对相关性的影响 data li11_1; input x y@@; cards; 11.0 0.5283 11.8 0.5299 12.0 0.5358 12.3 0.5292 13.1 0.5602 13.7 0.6014 14.4 0.5830 14.9 0.6102 15.2 0.6075 16.0 0.6411 ; proc corr; var x y; run; proc plot;plot y*x=*;run; 第二节 直线回归 相关分析是描述两变量之间相互关系 回归分析是分析两变量间是否有依存关系 一、直线回归方程 a称为截距, b称之为斜率或回归系数,表示 当自变量X每改变一个单位,因变量Y平均变动 的单位数。 最小二乘法: 二、实例求解回归方程 例11-2 某地测得10名3岁儿童的体表面积(m2)与体重(kg)资料见表11-1第2、3栏,试求3岁儿童由体重推算体表面积的回归方程。 二、实例求解回归方程 1、绘制散点图。 2、计算 77.55946 - 134.4×5.7266/10 b=───────────────= 0.02385 1831.24 - (134.4)2/10 3.绘制回归线 图11-5 三岁儿童的体表面积与体重的回归线 三、直线回归方程的假设检验 1、回归系数的假设检验——方差分析 F=89.024, P0.01 拒绝H0, 接受H1,回归方程有统计学意义,故可认为小儿体表面积与体重之间有直线回归关系存在。 2、回归系数的假设检验-t检验 SY.X为剩余标准差, P0.01 四、直线回归方程的应用 1、描述两变量间的依存关系 2、利用回归方程进行预测 所谓利用回归方程进行预测就是把自变量代 入回归方程,对应变量进行估计,可求出因变 量取值的波动范围,即个体Y值的预测区间 (prediction interval, PI)。 当X为某定值时 ,Y的1-α预测区间为: SY为总体中当X为某定值时Y的标准差, 例12-3:例12-2所得的回归方程: 若已知某3岁儿童的体重为13.5kg, 试估计该儿童体表面积:

文档评论(0)

1亿VIP精品文档

相关文档