- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5卫生统计学-10
* * * * * * * * * * * * * * 【第十章】 线性相关与回归 * 第一节 线性相关 一、线性相关的基本概念 例10.1 从男青年总体中随机抽取 11 名男青年组成样本,分别测量每个男青年的身高和前臂长,身高和前臂长均以cm为单位。 编号 身高X 前臂长Y 1 130 47 2 173 42 3 160 44 4 155 41 5 173 47 6 188 50 7 178 47 8 183 46 9 180 49 10 165 43 11 166 44 绘制11 名男青年身高与前臂长资料的散点图 * * * 相关系数 r 没有测量单位,其数值为 -l≤ r≤ +1 。 r 值为正,表示正相关;r 值为负,表示负相关。 r 值为 0, 则称零相关即无直线关系。 当 r 绝对值为 1 时,称完全相关。 (二)相关系数的定义 * (三)相关系数的计算 例10.1 从男青年总体中随机抽取 11 名男青年组成样本,分别测量每个男青年的身高和前臂长,身高和前臂长均以cm为单位。试计算身高与前臂长之间的相关系数 。 编号 身高X 前臂长Y 1 130 47 2 173 42 3 160 44 4 155 41 5 173 47 6 188 50 7 178 47 8 183 46 9 180 49 10 165 43 11 166 44 * 称作:Pearson相关系数 或 积差相关系数 这里 r 为正值,表示前臂长与身高呈现正相关。 由于 r 是样本统计量,对于男青年总体的身高与前臂长之间的相关关系,尚需进行进一步的假设检验。 * 第二节 等级相关 Pearson相关系数或积差相关系数,要求总体服从双变量正态分布,即两个变量各自的总体的分布均是正态分布。 秩相关或称等级相关是用双变量等级数据作直线相关分析,这类方法由于对原变量分布不作要求,故而属于非参数统计方法。 适用于下列资料: 1、不服从双变量正态分布而不宜作积差相关分析。 2、总体分布未知。 3、原始数据是用等级表示的。 * 学生 1 2 3 4 5 6 7 8 9 10 11 12 课程A 良 优 优 良 优 良 中 良 良 中 优 中 课程B 良 优 良 优 优 良 中 优 中 良 优 中 疗效(痊愈、显效、好转、无效)与病情(轻、中、重)。 常用的等级相关方法是 Spearman 等级相关 。 Spearman 样本相关系数 rs * 第三节 线性回归 一、线性回归基本概念 问题:儿童年龄X,儿童体重Y,问,当X=3岁时,Y=? 相关分析解答了“X和Y之间有没有相关关系?有多密切?” 但没有回答“这个关系是什么?” 线性回归分析可以回答“这个关系是什么?” * 线性回归是研究两个变量之间线性关系的数量表达式。其中一个变量称自变量,用X表示;另一个称因变量,用Y表示。 总体线性回归方程为: 根据样本观察资料可以求出 ? 及 ? 的估计值 a 及 b,并建立样本回归方程: * X Y x1 y1 x2 y2 … … xn yn * 二、线性回归方程的计算 例10.3 有人研究了温度对蛙的心率的影响,得到了表中所示的资料,试进行回归分析。 编号 温度X 心率Y 1 2 5 2 4 11 3 6 11 4 8 14 5 10 22 6 12 23 7 14 32 8 16 29 9 18 32 10 20 34 11 22 33 * 线性回归方程主要应用 : 1、确定两个变量之间是否存在依存关系,如果存在依存关系,则可以利用回归方程描述 X 和 Y 之间的数量关系; 2、用回归方程对因变量 Y 进行估计,也就是把自变量 X 代人回归方程对因变量 Y 进行估计。 * 三、线性回归方程的假设检验 X Y -1 1 -2 4 -3 9 0 0 1 1 2 4 3 9 4 16 * * (一)方差分析 变异来源 平方和SS 自由度f 均方MS F值 P 总变异 SS总 n-1 回归 SS回归 1 SS回归/1 MS回归/MS剩余 剩余 SS剩余 n-2 SS剩余/(n-2) * 变异来源 平方和SS 自由度f 均方MS F值 P 总变异 1108.55 10 回归 1020.23 1 1020.23 103.99 <0.01 剩余 88.32 9 9.81 * (二)t检验 * * 3、相关回归可以互相解释 当 SS 总不变的情况下,SS回归的大小决定了相关系数的大小 ,R2 反映出SS回归在SS总中所占的比重。 R2 越接近 1,回归效果越好。 应用确定系数,也可以从回归的角度对相关程度做进一步的了解。例如,r=0.5,R2=0.25,说明一个变量的变异仅有 25% 由另一变量所引起,避免了对相关系数表示的相
文档评论(0)