- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两变量关联性分析
在大量的医学研究中我们需要对两个随机变量之间的
关系进行量化研究,一是确定两个变量间是否有联系
及联系强度大小,二是定量地确定它们之间的相互依
存关系。
如研究某年龄儿童的身高与体重的关系、血压与年
龄、体温与脉搏、疗效与药物剂量等的关系。
;第一节 直线相关
一、直线相关的概念及其统计描述
例1 某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,数据如表1所示。据此回答两变量是否有关联,其方向与密切程度如何?
;表1 15名正常成年人的体重与双肾体积的测量值; 1.散点图
15个人的一对对测得值可看成(x, y)的样本取值,据
此在直角坐标系中标出对应的点来,这样的图形称为
散点图。
;图1 15名正常成年人体重和双肾体积的散点图;由于x、y两个变量都是随机变量,它们间的关系不可能像函数关系那样,能以一个变量的数值精确地确定出另一个变量的数值,我们称这类变量之间的关系为非确定性关系。
两个随机变量x、y之间大致呈直线趋势的关系称为直线相关,又称简单相关,直线相关的性质可由散点图直观 说明。
散点图的作用能使我们直观地看出两变量间有无关系。 正相关、负相关、非直线相关和零相关。
;0 r 1 ;-1 r 0 ;r =1 ;r =-1;r = 0 ;r = 0 ; 二、相关系数的意义及计算
直线相关系数又称Pearson积矩相关系数,是用以定量描述两个变量间直线关系密切程度和相关方向的统计指标。 ;; 相关系数的特点:
(1) 直线相关系数r是一个没有单位的数值,且-1≤r≤1;
(2) r0为正相关,r0为负相关, r=0为零相关;
(3) r的绝对值越接近1,说明相关性越好或密切程度越
高;r的绝对值越接近0,说明相关性越差或密切程
度越低。;例2 计算上述例1中体重与双肾体积之间的样本相关系数。
本例计算过程如下表: ; ; 说明双肾体积随体重增加而增大,两变量呈正相关。 ; 三、相关系数的统计推断
我们在实际工作中,常常只能得到样本相关系数r.
因此需要对总体相关系数ρ是否等于零进行假设检验.
H0:ρ=0
H1:ρ≠0
假设检验的假设前提为x和y均服从正态分布。
; 两种常用的检验方法:
(一) 直接查r界值表
根据自由度v=n-2,查r界值表,用r绝对值与界值进行
比较,统计量越大,概率P越小;统计量越小,概率P
越大。; (二) 采用t 检验,实际应用中使用得比较普遍
; 例3 在例2算得r=0.875后,试检验相关是否有统计学意
义。
①. 建立假设
H0:ρ=0
H1:ρ≠0
②. 确定检验水准
α=0.05
③. 方法1:
由自由度v=15-2=13,查附表13 r界值表,得p0.001.
; 方法二:
④. 确定概率P值
v=n-2=15-2=13,tr=6.517,查 t 界值表,
得p0.001。
⑤. 下结论
因为p0.001,按?=0.05水准,拒绝H0,接受
H1,差异有统计学意义。即双肾体积与体重之间
存在直线相关关系。
;假设检验是回答两变量间的相关关系是否具有统计学意义,p值越小并不表示相关性越强,回答相关的强弱需要计算总体相关系数的ρ置信区间。由于一般情况下(ρ≠0时) ρ的分布并不对称,故先对r按(1)式作z变换:
由于变换后的z近似地服从于均数为 ,标准差为 的正态分布,故z的(1- ?)置信区间按下式计算:
;将(2)式的上、下限代入下列(3)式,即得到总体相关系数ρ的(1- ?)置信区间。
;例3(续) 在例2算得r=0.875后,试估计总体相关系数ρ的95%置信区间。
将r=0.875代入(1)式,得
将z=1.3540, 和代入(2)式得z的95%置信区间为(0.7882, 1.9198);将z的上、下限分别代入(3)式,得;ρ的下限:
文档评论(0)