第九章 双变量回归与相关(简化版,正式).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 双变量回归与相关(简化版,正式)

* * e 0 * 0 0 0 0 e e e e 离群值 缺乏二次项 方差不齐 不独立 * P值越小越有理由认为变量间直线关系 存在,不能说关系越密切。 直线回归关系可以内插,不宜外延。 当样本含量较大时,统计学检验的作用 减弱。r0.05/2,100=0.195 4.结果的解释及正确应用 * 第三节 秩相关 Rank Correlation 一、Spearman 秩相关 * 应用条件: 1.不服从双变量正态分布而不宜作积差 相关分析; 2.总体分布类型未知; 3.原始数据用等级表示。 * 死因类别 死因构成(%) WYPLL构成(%) (1) X(2) Y(4) 1 0.03 0.05 2 0.14 0.34 3 0.20 0.93 4 0.43 0.69 5 0.44 0.38 6 0.45 0.79 7 0.47 1.19 8 0.65 4.74 9 0.95 2.31 10 0.96 5.95 11 2.44 1.11 12 2.69 3.53 13 3.07 3.48 14 7.78 5.65 15 9.82 33.95 16 18.93 17.16 17 22.59 8.42 18 27.96 9.33 合 计 — — WYPLL: work years of potential life lost 表9-3 某省1995年到1999年居民死因构成与WYPLL构成 * 死因类别 死因构成(%) WYPLL构成(%) (1) X(2) P(3) Y(4) Q(5) (6)=(3)-(5) (7)=(6)2 1 0.03 1 0.05 1 0 0 2 0.14 2 0.34 2 0 0 3 0.20 3 0.93 6 -3 9 4 0.43 4 0.69 4 0 0 5 0.44 5 0.38 3 2 4 6 0.45 6 0.79 5 1 1 7 0.47 7 1.19 8 -1 1 8 0.65 8 4.74 12 -4 16 9 0.95 9 2.31 9 0 0 10 0.96 10 5.95 14 -4 16 11 2.44 11 1.11 7 4 16 12 2.69 12 3.53 11 1 1 13 3.07 13 3.48 10 3 9 14 7.78 14 5.65 13 1 1 15 9.82 15 33.95 18 -3 9 16 18.93 16 17.16 17 -1 1 17 22.59 17 8.42 15 2 4 18 27.96 18 9.33 16 2 4 合 计 — 171 — 171 — 92 表9-3 某省1995年到1999年居民死因构成与WYPLL构成 * 或用秩Pi、Qi直接计算积差相关系数r 附表14(n≤50) * 讲课内容: 第一节 直线回归(重点) 第二节 直线相关(重点) 第三节 秩相关 * Thank you! * * * * * * * * * * * * * * * * * * * * * * * (2)计算检验统计量 t 值 (1)建立检验假设并确定检验水准 (3)确定P值下结论 * (二)总体回归系数?的可信区间 此区间不包括β=0,结论为b有统计学意义。 * (三)利用回归方程进行估计与预测 1.总体均数 的可信区间 : 给定X后对应Y的总体均数 给定X后对应Y的样本均数 * 2.个体Y值的容许区间 给定X后对应个体Y值波动范围 * X Y (体重,kg) (体表面积,103cm2 ) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.1 5.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2 6.075 16.0 6.411 例 某地10名三岁儿童体重与体表面积 * 11 12 13 14 15 16 4.5 5.0 5.5 6.0 6.5 7.0 可信区间与容许区间示意 (confidence band tolerance band) X 体重 Y 体表面积 * 第二节 直线相关 Linear Correlation * 生物遗传学上的“相关” 在回归分析中,有理由认为父亲身高决定儿子身高,故把父亲身高作为自变量X,儿子身高作

文档评论(0)

5500046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档