第八章相关与回归课件.ppt

  1. 1、本文档共93页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归分析法产生的历史 回归分析法。由著名的英国生物学家、统计学家高尔顿(F.Gallton)——达尔文的表弟所创。 早年,高尔顿致力于化学和遗传学领域的研究。 他研究父亲们的身高与儿子们的身高之间的关系时,建立了回归分析法。 父亲们的身高与儿子们的身高之间 关系的研究 1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录 企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式 下图是根据1078个家庭的调查所作的散点图(略图) 从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下: TSS=RSS+ESS 总离差平方和 回归平方和 误差平方和 误差平方和 回归 平方和 总离差平方和 确定回归直线后,需要评价这一直线方程是否有效地反映了这两变量之间的关系。评价回归方程配合好坏的一个主要指标是判定系数(或称确定系数) 是相关系数的平方,用 表示;用来衡量回归方程对y的解释程度。 判定系数取值范围: 越接近于1,表明x与y之间的相关性越强; 越接近于0,表明两个变量之间几乎没有直线相关关系. 2、判定系数 判定系数 r2 表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释 r 的符号同 b 判定系数的计算公式 判定系数与相关系数的关系 0 -10 -7 -9 -2 5 3 -5 4 13 8 95546 7426 8000 7776 9020 10292 10080 8840 10492 12180 11440 - 47.29 49.45 51.61 53.76 55.92 58.08 60.24 62.39 64.55 66.71 估计值 1670 158 160 162 164 166 168 170 172 174 176 身高 0 33032 279220 570 -9.71 -7.55 -5.39 -3.24 -1.08 1.08 3.24 5.39 7.55 9.71 2209 2500 2304 3025 3844 3600 2704 3721 4900 4225 24964 25600 26244 26896 27556 28224 28900 29584 30276 30976 47 50 48 55 62 60 52 61 70 65 A B C D E F G H I J 体重 学生 X Y 在直线相关的条件下,用以反映两变量 间线性相关 密切程度的相关系数称为简单相关系数。 二、相关系数 (一)相关系数的含义 相关系数是测度变量之间相关关系程度的指标。 其基本算法是英国统计学家皮尔逊所创的乘积动差法,简称积差法。 (二)简单线性相关系数 若相关系数是依据总体全部数据计算的,称为总体相关系数。记为ρ;若是依据样本数据计算的,则称为样本相关系数,即为r 。 (三)相关系数的取值范围和意义 相关系数r的取值范围:-1≤r≤1 r>0 为正相关,r < 0 为负相关; |r|=0 表示不存在线性关系; |r|=1 表示完全线性相关; 0<|r|<1表示存在不同程度线性相关: |r| < 0.4 为低度线性相关; 0.4≤ |r| <0.7为显著性线性相关; 0.7≤|r| <1.0为高度显著性线性相关。 (四)相关系数的计算 1、按极差法相关系数公式计算 2、相关系数的简捷计算法 【例】计算工业总产值与能源消耗量之间的相关系数 资料 37887 840 950 960 1176 1568 1612 1998 2360 2542 2560 3055 3400 3381 3621 3456 4408 xy 26175 576 625 576 784 1024 961 1369 1600 1681 1600 2209 2500 2401 2601 2304 3364 y2 55086 625 916 合计 1225 1444 1600 1764 2401 2704 2916 3481 3844 4096 4225 4624 4761 5041 5184 5776 24 25 24 28 32 31 37 40 41 40 47 50 49 51 48 58 35 38 40 42 49 52 54 59 62 64 65 68 69 71 72 76 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 x2 工业总产值(亿元)y 能源消耗量(十万吨)x 序号 结论:工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量x的变化能够解释工业

文档评论(0)

xiexie2012 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档