- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章 两变量关联性分析
一般地,两个连续随机变量间的线性联系称为线性相关(linear correlation),也称为简单相关(simple correlation),两个分类变量间的联系则称为关联(association)。
散点图
判断两个变量是否具有相关关系最直观的办法是绘制散点图(scatter plot),在实际研究中也是首先要做的一步。将两变量置于直角坐标轴上,把其中一变量取作X, 另一个取作Y,据此在直角坐标系(X,Y ) 中标出对应的点来,这样的图形称作散点图。常见的散点图如图11-2所示。
相关的种类
1)正相关(positive correlation):一般地,在图中若有随增大而线性上升的趋势,则称为正相关。
2)负相关(negative correlation):在图中若有随增大而线性下降的趋势,则称负相关。
3)零相关(zero correlation):在图中若或不随另一变量的改变而改变 ,则称零相关。
4)非线性相关(nonlinear correlation) :若散点呈曲线形状,则变量间可能呈曲线关系,不宜做线性相关。
关联强度指标--相关系数
意义:相关系数(correlation coefficient)又称Pearson积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。
2. 计算:样本相关系数的计算公式为
(11-3)
相关系数的特点
1.相关系数r是一个无量纲的数值,且-1r1;
2.r0为正相关,r0为负相关;
3./r/越接近于1,说明相关性越好./r/越接近于0,说明相关性越差.
例11-2 计算例11-1中凝血酶浓度X与凝血酶时间Y之间样本相关系数。
由例11-1得
,
,
由公式11-3得
相关系数的统计推断
相关系数的假设检验
直接查相关系数临界值表; t检验
(11-5)
(11-6)
例11-3 继例11-2中算得r=-0926后,试检验相关是否具有统计学意义
检验步骤
本例 n=15,r=-0.926,由公式(11-4)和公式(11-5)得
本例 ,查 界值表得 ,故拒绝 接受 ,认为凝血酶浓度与凝血酶时间之间存在负相关。此结果与查表的结果是一致的。
线性相关中应注意的问题
1.样本的相关系数接近零并不意味着两变量间一定无相关性.两个有联系的变量并非都属线性联系。两变量间无线性关系,但却存在非线性的曲线联系。例如,很高血压和很低血压的人死亡率均较高, 而中等血压的人死亡率较低, 于是, 死亡率和血压之间有曲线性联系。还有如血液浓度与时间之间的关系、某放射性污染物对环境的污染浓度与污染源距离之间的关系等,都有曲线性联系,但它们的样本相关系数却都接近零。
故通常应先绘出样本值的散点图,利用散点图可直观地判断两变量之间是否具有线性联系。
2.一个变量的数值人为选定时莫作相关.
.一个变量的数值随机变动,另一个变量的数值却是人为选定的。例如, 为研究药物的剂量-反应关系
3.出现异常值时甚用相关.
4.相关未必真有内在联系.
5.分层资料盲目合并易出假象
第二节 秩相关(rank correlation)
等级相关
适用条件:
①资料不服从双变量正态分布而不宜作积差相关分析;
②总体分布型未知,一端或两端是不确定数值(如<10岁,≥65岁)的资料;
③原始数据用等级表示的资料。
一、Spearman秩相关
1. 意义:等级相关系数rs用来说明两个变量间直线相关关系的密切程度与相关方向。
2. 计算公式 d为p,q之差
例11-4 某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析
表11-2 急性白血病患儿的血小板(109/L)和出血症状
病人编号 血小板数 秩次 p2 出血症状 秩次 q2 pq
X p Y
文档评论(0)