第十三章 双变量关联性分析.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
单变量分析方法(univariate analysis):t检验、u检验、方差分析 双变量分析方法(bivariable analysis) :直线回归与相关、秩相关等 直线相关 直线相关的概念 用相关系数描述两变量间直线关系的密切程度和方向 相关系数又称Pearson 积矩相关系数,样本相关系数用r表示,总体相关系数用 表示 相关的种类 相关的种类 正相关:0 r 1 完全正相关: r =1 负相关:-1 r 0 完全负相关: r =-1 零相关:r =0 相关系数没有单位,其值为-1≤r≤1 相关系数的意义 相关密切程度:用r的大小表示,r的绝对 值越接近于1,说明相关越密切 相 关 方 向 : 用r的正负号表示 P164 例13.1 某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,数据如表13.1所示。据此回答两变量是否有关联?其方向与密切程度如何? 直线相关的计算步骤 绘制散点图:观察散点是否随一变量的变化而变化,所有散点是否呈直线关系 直线相关的计算步骤 计算样本相关系数(本例r =0.875) 相关系数的假设检验 检验r是否来自总体相关系数?为零的总体。 常用t检验: Ho: ?=0,两变量间无直线相关关系 H1: ?≠0 两变量间有直线相关关系 =0.05 查附表3,t界值表,得p0.001,,拒绝Ho,可以认为体重和双肾体积之间有直线相关关系。 相关分析应用中应注意的问题 1. 进行相关分析前应先绘制散点图 散点图能使我们直观地看出两变量间有无线性关系并发现可能的离群点(outlier),当散点有线性趋势时,才能进行相关分析。 2. 出现离群点时慎用相关 3. 分层资料不可盲目合并 3. 分层资料不可盲目合并 3. 分层资料不可盲目合并 3. 分层资料不可盲目合并 直线回归与直线相关的区别与联系 区 别 1、资料要求不同 回归:y服从正态分布,x没有特别的 要求 相关:x和y服从双变量正态分布 (若x数值系人为选定,莫作相关 例 药物的剂量-反应关系) 区 别 2、应用情况不同 回归:反映两变量间的数量关系(b) 相关:反映两变量间互依的程度和方向(r) 提问方式不同 年龄增加,血压发生什么样的变化? 年龄和血压之间有关系吗? 联 系 1、方向一致:对同一组数据若同时计算r和b,其正负号是一致的 Question: r和b的大小有关系吗?r较大,是否b也较大? 联 系 2、假设检验等价:r和b的假设检验是等价的,即对同一样本,两者的t值相等,检验结果完全一致 联 系 3、用回归解释相关 r的平方称为决定系数 决定系数r2 表示回归平方和占总平方和的比例,即应变量y的总变异中由自变量x可以解释的比例。 SS回越接近于SS总,则r2越接近于1,说明引入相关变量的效果越好 当相关系数较小时,若引入回归,可能由于减少的误差太少而无实际意义 example 如 r=0.20,n=100时,P0.05,r有统计学意义。但r2=0.04,表示SS回在SS总中仅占4%,说明两变量相关分析的实际意义不大。 应用直线回归和相关的注意点 1、作回归和相关分析之前,先绘制散点图 2、据资料的性质正确选用回归和相关 3、用回归方程进行预测的时候,应当谨慎。X不能偏离实测范围太远,否则偏差太大。 example x:20~50妇女年龄 y:血压 x=0时, 应用直线回归和相关的注意点 4、相关关系不一定是因果关系,也可能是伴随关系 如某生春种一植物,不久长出幼苗。恰邻院盖楼,细心观测,苗长楼增。计算发现,苗高与楼高具有相关性。 两者是否真有内在联系? 例:1875~1920,美国年铁制品产量与英国年出生率相关系数为-0.98 因素:社会、经济、技术 应用直线回归和相关的注意点 5、不能只根据相关系数的绝对值大小来判断相关的密切程度,应首先作假设检验 例:r=0.601 n=8 p=0.10~0.20 r=0.401 n=42 p=0.005~0.01 应用直线回归和相关的注意点 6、 和 为零仅说明没有变量间没有直线关系,不能说明变量间没有关系 秩 相 关 秩相关适用条件 原始数据只能以等级表示 总体分布未知 不服从双变量正态分布 P169 例13.4 某研究者对15例30~50岁成年男子的舒张压(mmHg)与夜间最低血氧含量分级进行研究,结果见表13.2,试分析两者的关联性。 rs的计算 将x及y的秩次直接代入直

您可能关注的文档

文档评论(0)

2232文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档