医学统计学课件相关与回归.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 线性相关与回归 教师:卫生统计教研室 胡冬梅 世间万物是普遍联系的 医学上,许多现象之间也都有相互联系 糖尿病病人的血糖与胰岛素水平的关系; 某人群年龄与收缩压的关系; 儿童身高与体重的关系; 动物实验中动物进食量与增加体重的关系等。 常用回归与相关分析,属双变量分析范畴(bivariate analysis)。 相关就是用于研究和解释两个变量之间相互关系的,给两个变量定性。 回归是设法找出变量间的依存变化(数量)关系, 用函数关系式表达出来,给出两个或多个变量的定量的关系 第一节 线性相关 相关关系 当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。 相关关系不一定是因果关系。 相关分析的任务: 两变量间有无相关关系? 两变量间如有相关关系,相关的方向?相关的程度? 主要内容 一、散点图 二、相关系数 三、相关注意事项 直线相关的资料要求: 直线相关(linear correlation),又称简单相关,用于双变量正态分布资料。 例如,同性别成人的身高与体重的关系: 对某一身高(如女性160cm),体重为正态分布; 对某一体重(如女性50kg),身高为正态分布。 一、散点图 为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。 作法:为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 作用:粗略地给出了两个变量的关联类型与程度 相关类型: 二、相关系数 相关系数(correlation coefficient)是衡量两个连续变量之间关联的强度的指标,样本的相关系数用r 表示,总体的相关系数用ρ表示。 相关系数取值: -1≤相关系数≤1 二、相关系数 正相关: 0<r≤1,散点云图是斜向上的,这时一个变量增加,另一个变量也增加; 负相关:-1≤r<0,散点云图是斜向下的,此时一个变量增加,另一个变量将减少。 相关系数的绝对值越接近1,两变量的关联程度越强,相关系数的绝对值越接近0,两变量的关联程度越弱。 二、相关系数 r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。 相关系数计算 公式: Pearson 原理:取图形的中心点O’( ),任意一点P(x,y) 三、相关系数的显著性检验 相关系数的假设检验 查表法 当n≤52,v=n-2,查r界值表,得到P值 t检验法 当n52,计算检验统计量tr,查t界值表,得到P值 相关注意事项 线性相关的前提条件是X、Y都服从正态分布(双变量正态分布) 必须在假设检验认为相关的前提下才能以r的大小判断相关程度 相关关系并不一定是因果关系,有可能是伴随关系 前面我们讨论了身高和前臂长之间的关系,知道了二者之间成正相关。那么,如果我们知道了一人的身高,能推断出其前臂长吗?或前臂长可能在什么范围内呢?还有,随着身高的增加,体重也在增大,它们之间也成正相关关系。那么,身高每增加1厘米,体重增加多少克呢?上面的相关关系分析不能提供给我们需要的答案。这些要用直线回归的方法来解决。 第二节 线性回归 主要内容 一、线性回归基本概念 二、线性回归方程计算 三、线性回归方程的假设检验 四、回归注意事项 一、线性回归基本概念 自变量(X):容易得到的、变化小的量,原因 因变量(Y):不容易得到的、变化大的变量、结果 当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系,但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为直线回归方程,这种关系为直线回归. 二、线性回归方程的计算 式中的 是由自变量X推算应变量Y的估计值,a是回归直线在Y 轴上的截距,即X=0时的Y值;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。 计算原理:最小二乘法,即保证各实测点到回归直线的纵向距离的平方和最小,并使计算出的回归方程最能代表实测数据所反映出的直线趋势。 二、线性回归方程的计算 三、回归方程的假设检验 与直线相关一样,直线回归方程也是从样本资料计算而得的,同样也存在着抽

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档