- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[2018年最新整理]双变量关联性分析
第十三章 变量关联性分析在医学研究中,常会观察到两个变量之间在数量上存在某种协同变化的关系,例如随着体内凝血酶浓度的升高,其凝血时间随之降低类关系在统计学上称为两个随机变量之间的关联性。如何判断关联性是否确实存在以及描述关联的方向与密切程度是本章所要介绍的内容。需要指出的是关联性只反映变量间数量上的关系,数量上的关联并不表示专业上的因果关系是否反映变量间的因果关系还需其手段确认。本章介绍两个定量变量间的直线相关和两个分类变量间关联性的统计分析方法。第一节 直线相关
一、直线相关的概念及其统计描述
例13.1 某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,数据如表13.1所示。据此回答两变量是否有关联?其方向与密切程度如何?
表13.1 15正常成年人体重双肾体积的测量值
编号 体重(kg) 体积(ml) 1 43 217.22 2 74 316.18 3 51 231.11 4 58 220.96 5 50 254.70 6 65 293.84 7 54 263.28 8 57 271.73 9 67 263.46 10 69 276.53 11 80 341.15 12 48 261.00 13 38 213.20 14 85 315.12 15 54 252.08 初步判断两变量间关系最直观有效的方法就是在平面直角坐标系中绘图,一个变量用表示,另一变量用表示,在平面直角坐标系中可绘制这些点的分布情况,称为散点图(scatter plot)如图13.1所示。
体重 (kg)
图13.1 15正常成年人体重双肾体积的散点图
可见两变量的散点分布大致呈直线趋势其数量变化的方向相同。在统计学上两个随机变量之间呈直线趋势的关系被称为(linear correlation),又称简单相关(simple correlation),其性质可由图13.2所示散点图作直观说明。
() (b) (c) (d)
图13.2 常见的散点图
图13.2()、()中散点呈椭圆形分布,其变化趋势接近一直线,其中图(a)中两变量同时增大或减小,变化趋势同向,称为正相关(positive correlation)图(b)中变化趋势相反,称为负相关(negative correlation)如全部数据点恰好散布在一条直线上,称为完全相关实际中不存在图(c)中各点总的趋势杂乱无章或大致呈圆形散布,则该两变量间无相关,也称零相关(zero correlation)图(d)中各点散布也非直线趋势,亦属无相关,由于统计学中提到的相关通常是指直线相关,故无相关是指无关系但可能存在非直线相关。
二、相关系数的意义及计算
定量描述两个变量间直线关系的方向和密切程度的指标,系数(linear correlation coefficient)又称Pearson积矩相关系数(Pearson product moment coefficient),其公式为:
(13.1)
相关系数没有单位,取值范围在之间,其表示两变量间的方向,大于0为正相关,小于0为负相关,等于0为零相关相关系数绝对值大小表示两变量间直线相关的密切程度,绝对值越接近于1,说明相关密切程度越高绝对值越接近于0,说明相关密切程度越低。现结合图13.1解释相关系数的含义。经横纵标上与处两条相互垂直的直线可将此图分为个象限,若两变量呈正相关,多数数据处于、象限,此时式(13.1)的分子为正数;若两变量呈负相关,多数数据处于、象限,此时式(13.1)的分子为负数。其中一个极端是所有数据均位于经过点,)的直线上,数据点都在、象限,都在、象限,此时式(13.1)的分子各项正负号完全相同,相加后得到其最大或最小值,,分别对应于完全正相关或完全负相关;另一个极端是所有数据围绕点()成圆形均匀分布在4个象限内,此时式(13.1)的分子各项相加后正负号相互抵消,分子为0,即零相关。
通过以上解释可知式(13.1)中位于分子的离均差乘积和)可反映两变量相关的方向和密切程度。单变量描述中用离均差平方和的平均即方差来数据离散程度以消除样本量的影响一样,可将两变量离均差乘积和取平均,得到样本协方差以便不同样本的问题比较其相关性用符号表示计算公式:
(13.2)
协方差的取值大小的量纲不同问题中的协方差不可比较将两变量分别进行标准化(每个观察值减去均数再除以其标准差)后再计算协方差,使之成为无单位的系数便于不同问题进行比较如此得到标准化的协方差即相关系数的另一种:
(13.
您可能关注的文档
最近下载
- GPS控制网的布设方法.ppt.ppt VIP
- 公关语言学幻灯片.ppt VIP
- 2019版最新18项护理核心制度.docx VIP
- GPS静态网的布设.ppt VIP
- DB32T 2887-2016 曳引电梯钢丝绳电磁检测方法 .pdf VIP
- 《宁夏闽宁镇:昔日干沙滩,今日金沙滩》-中职语文高二同步课件精选(高教版2023·职业模块).pptx VIP
- 2025年5月18日河南省事业单位招聘考试《公共基础知识》试题(含答案).docx VIP
- 2025年5月18日河南省事业单位招聘考试《职业能力测试》试题(含参考答案).docx VIP
- 数据挖掘教案.doc
- DB42T 2390-2025 城市更新规划编制技术规程.docx VIP
文档评论(0)