- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]第9章 直线相关与回归
两变量(X,Y) 1. 相关系数(?, r) 表示两变量直线相关的密切程度和方向。 相关系数波动范围: -1 ? r ? 1 (1)密切程度: |r| ? 1,相关越密切; |r| ? 0,相关越弱。 r=1或 -1,称完全相关; r=0, 称零相关,表示不存在直线相关关系,但不排除存在某种曲线关系的可能性。 (2)方向: r 0, 正相关; r 0, 负相关。 四、等级相关(秩相关 rank correlation ) 1. 适用于下列资料: (1)不服从双变量正态分布的资料(如二项分布); (2)总体分布型未知; (3)原始数据是用等级表示。 2. 等级相关系数(rs)意义 不用原始数据计算,而是根据数值大小的秩次进行计算。其意义同直线相关系数。 2. 曲线配合的基本步骤 (1)绘制散点图; (2)根据两变量间相关变化的曲线类型选择适当的曲线方程; (3)用计算机有关统计软件进行拟合; (4)根据配合适度指标(常用决定系数R2)来确定最优方程。 例: 例1中,当X=15,求个体Y值的预测区间(?=0.05)。 5. 直线回归方程的应用 (1)预测: 即把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计。 1)点预测: 2)区间预测: 区间预测: 当X是已知时,按一定概率估计应变量所在范围。 可按求个体Y值预测区间方法计算。 例:例1资料中,当胰岛素浓度X=15mU/L时,试估计血糖浓度(?=0.05)。 (2)控制: 指当要求应变量Y在一定范围内波动时,如何控制自变量X的取值。 例 :已知血糖正常范围为(4.44~6.66 mmol/L),在前例资料的基础上,问欲将血糖水平控制在正常范围内时,血中胰岛素应维持在什么范围内(?=0.05) ? 解得:X( 33.95, 38.79)mU/L 二、直线相关(linear correlation) 2. 相关分析的步骤 (1)绘制散点图观察两变量间是否呈直线趋势 20名糖尿病人的血糖水平与胰岛素水平的散点 (2)计算相关系数 计算例1资料的相关系数 Pearson 相关系数 积差法相关系数 3. 相关系数的假设检验 例1 资料: H0: ? = 0 ; H1: ? ≠0;?=0.05 查表得:P 0.01 (结果同回归系数检验) c t 检验 查表法:P.719 r界值表。 三、应用直线回归时注意事项 1)应有实际意义; 2)分析前应绘制散点图; 3)用残差图考察数据是否符合模型假设条件 4)应在实际回归范围内绘制回归直线; 5)结果的解释及正确应用 残差分析——模型诊断 通常以标准化残差(standardized residual)为纵坐标,以 为横坐标,作残差图。 A B C D E F 残差呈随机分布 残差不满足方差齐性条件 存在非线性关系 有异常点 3. 等级相关系数的计算 (1)按直线相关系数公式计算,只是用秩次代替原始观察值。 (2)Spearman公式法: 例 为研究饮水中氟含量与氟中毒患病率之间的关系,测定了9个居民点井水中的氟含量X(mg/L),并同时通过体检得到这些居民点中常住居民的氟中毒患病率Y(%),资料如下表: 4. 等级相关系数的假设检验 H0: ?s = 0 ; H1: ?s ≠ 0;?=0.05 (1)查表法:n ? 50时,查rs界值表(P.721)进行假设检验。 查表得:rs 0.001(9) = 0.933, P0.001 (2) 计算法: 以ν=9-2=7查t界值表,得P<0.001 SPSS 双变量资料的相关分析方法选择 直线相关(Pearson相关)——双变量正态 等级相关(Spearman相关)——非双变量正态或等级资料。 X2检验——分类资料或等级资料 讨 论 题 1. 某地防疫站用碘剂局部注射治疗219例地方性甲状腺肿,结果如下表,问患者年龄与疗效有无关联? 219 14 53 43 109 合计 49 5 23 11 10 50~ 35 2 8 10 15 40~ 44 2 12 13 17 30~ 51 2 9 8 32 20~ 40 3 1 1 35 11~ 无效 好转 显效 治愈 合计 疗 效 年龄(岁) 地方性甲状腺肿患者各年龄组疗效观察结果 两变量之间不呈直线而是呈曲线关系时,要用适当的曲线方程来描述两变量间的关系。 1. 曲线的类型 如指数曲线、幂曲线、多项式曲线、生长曲线等
您可能关注的文档
- [物理]三相异步电动机相关基础知识.pdf
- [物理]同步电机.ppt
- [物理]土的物理性质指标与分类.ppt
- [物理]坐标系中的轴对称和位似变换.ppt
- [物理]园林设计与实训第一章.ppt
- [物理]导热基本定律及稳态导热.pdf
- [物理]形位公差基础理论.pdf
- [物理]我国核电安全分析.doc
- [物理]数字信号处理第3章 离散傅里叶变换DFT.ppt
- [物理]热力学湿空气.ppt
- 搅拌设备生产制造项目可行性研究报告写作模板-备案审批.doc
- 领导形象与领导力培训.pptx
- 广东省汕头市普通高中2025-2026学年高三上学期12月期中调研测试英语试 2025.pdf
- 广东省佛山市成考专升本2025-2026学年大学语文自考真题(含答案).pdf
- 广东省清远市四校2025-2026学年高一下学期期中联考语文试题.pdf
- 幼儿游戏与指导知到章节答案智慧树2025年嘉兴学院.pdf
- 年黑龙江省哈尔滨市第四十七中学中考一模英语试题(含答案)2025.pdf
- 广东省汕头市成考专升本2025-2026学年大学语文真题及答案.pdf
- 建设年产12000吨氟硅酸盐新材料项目可行性研究报告写作模板-拿地申报.doc
- 年投资银行业务保荐代表人之保荐代表人胜任能力练习题(一)及答案20253.pdf
文档评论(0)