- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 相关与回归 统计学PPT 课件
回归分析法产生的历史 回归分析法。由著名的英国生物学家、统计学家高尔顿(F.Gallton)——达尔文的表弟所创。 早年,高尔顿致力于化学和遗传学领域的研究。 他研究父亲们的身高与儿子们的身高之间的关系时,建立了回归分析法。 父亲们的身高与儿子们的身高之间关系的研究 1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录 企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式 下图是根据1078个家庭的调查所作的散点图(略图) 从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下: 如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”——见1889年F.Gallton的论文《普用回归定律》。 后人将此种方法普遍用于寻找变量之间的规律 总偏差 = 回归偏差 + 剩余偏差 r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释 r 的符号同 b 数量关系及意义 判定系数与相关系数的关系 0 -10 -7 -9 -2 5 3 -5 4 13 8 95546 7426 8000 7776 9020 10292 10080 8840 10492 12180 11440 - 47.29 49.45 51.61 53.76 55.92 58.08 60.24 62.39 64.55 66.71 估计值 1670 158 160 162 164 166 168 170 172 174 176 身高 0 33032 279220 570 -9.71 -7.55 -5.39 -3.24 -1.08 1.08 3.24 5.39 7.55 9.71 2209 2500 2304 3025 3844 3600 2704 3721 4900 4225 24964 25600 26244 26896 27556 28224 28900 29584 30276 30976 47 50 48 55 62 60 52 61 70 65 A B C D E F G H I J 体重 学生 判定系数与相关系数的区别: 判定系数无方向性,相关系数则有方向,其方向与样本回归系数 b 相同; 判定系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向; 相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。 相关关系不等于因果关系; 相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系; 极端值可能影响相关系数。 注意相关关系成立的数据范围。 警惕虚假相关 使用相关系数时应注意的问题: 《统计学》第十章 相关与回归 第二节 等级相关与品质相关 等级相关 由于社会经济现象的复杂性,有许多情形难以以精确数字形成统计数列,而只能根据主观判断,评定等级,依次排列。如对事态轻重、才智高低、艺术水平等的评价,都只能依据评判者的知识、经验、感受、有关规则等,作出相对大小的等级评定。 定序尺度的变量之间的相关关系。 等级相关系数的计算 该公式是由斯皮尔曼提出的,故也称为斯皮尔曼等级相关系数。 等级相关 见书例 1 1 0 16 1 1 4 4 16 0 44 -1 1 0 -4 1 1 -2 2 4 0 0 2 1 3 8 4 7 9 6 5 10 -- 1 2 3 4 5 6 7 8 9 10 -- (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) ∑ 2000年y 1999年x d2 等级差 d=x-y 等级 演员 编号 回归:退回regression 1877年 弗朗西斯?高尔顿爵士 遗传学研究 回归线 平均身高 《统计学》第十章 相关与回归 第三节 简单线性回归模型 回归分析法产生的历史 160 165 170 175 180 185 140 150 160 170 180 190 200 Y X 儿子们身高向着平均身高“回归”,以保持种族的稳定 回归分析法产生的历史 回归分析法产生的历史 第三节 简单线性回归模型 回归分析 通过一个变量x或一些变量(x1,x2,x3…)的变化解释另一变量y的变化.即根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法 回归:退回regression 回归方程 回归模型 反映自变量和因变量之间数学联系的表达式。 某一类回归方程的总称。 自变量(independent variable)
文档评论(0)