大学统计学原理经典课件第七章 相关与回归分析.ppt

大学统计学原理经典课件第七章 相关与回归分析.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大学统计学原理经典课件第七章相关与回归分析大学统计学原理经典课件第七章相关与回归分析

第七章 相关与回归分析 教学目的和要求 教学目的:培养对双变量数据资料进行相关分析和回归分析的基本能力。 教学要求:①了解相关关系的概念及种类;②掌握相关分析的原理、相关系数的测定方法及相关系数取值含义;③掌握回归分析的原理、方法及应用,重点掌握简单线性回归方程的拟合及应用,明确直线回归方程中待定参数的含义。 教学重点:相关分析与线性回归的基本步骤与方法,线性相关与线性回归系数的意义及应用。 变量之间的关系 学历和收入之间的关系 变量间的关系:一类是变量间存在着完全确定性的关系,这类变量间的关系称为函数关系。 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 相关关系与函数关系的联系 (1)都可用函数式加以描述,但表达式不同; (2)函数有时也可能表现为相关关系; (3)相关分析有时需要利用函数关系数学表达式来研究; (4)相关关系是相关分析的研究对象,函数关系是相关分析的工具。 相关关系的图示 相关分析的主要内容归纳起来有: (1)确定变量之间有无相关关系及其表现形式; (2)确定相关关系的密切程度。 第二节 简单线性相关分析 一、相关图和相关表 二、相关系数的测定与应用 先定性判断,后定量分析 (一)绘制相关图与相关表  1.简单相关表:是资料未经分组的相关表,它是把某一变量按照从小到大的顺序排列并配合另一变量值一一对应而平行排列起来的统计表。  四组数据(每个有两个变量的样本)的散点图 (5)|r|0.3为不相关,0.3|r|0.5低度相关,0.5|r|0.8明显相关,|r|0.8高度相关。 简单相关关系的取值及其意义 积差法的简化公式 得到公式: 相关系数的简捷公式 简单相关系数的方向和程度的决定因素 根据公式, 可以看出:简单相关系数为正或负,主要取决于式子   ,若 则说明是正相关;   ,则是负相关;    ,则是零相关。 可见简单相关系数的实质,是通过协方差来说明相关关系密切程度的。 用简捷公式的相关系数计算表 简单相关系数的算例 在计算时可以列出表格,将需要的数据列在表中的相应位置,以免出错。 第三节 直线回归分析 一、简单直线回归分析 二、多元线性回归分析 “回归”一词是由英国生物学家F.Galton在研究人体身高的遗传问题时首先提出的。根据遗传学的观点,子辈的身高受父辈影响,以 X 记父辈身高,Y 记子辈身高。虽然子辈身高一般受父辈影响,但同样身高的父亲,其子身高并不一致,因此,X和Y之间存在一种相关关系。一般而言,父辈身高者,其子辈身高也高,依此推论,祖祖辈辈遗传下来,身高必然向两极分化,而事实上并非如此,显然有一种力量将身高拉向中心,即子辈的身高有向中心回归的特点。“回归”一词即源于此。 (一)回归分析的概念及实质   1.回归分析概念:是对具有相关关系的两个或两个以上变量之间的数量变化进行数量测定,配合一定的模型,以便对因变量进行预测的一种统计分析方法。   2.回归分析的实质:是在相关分析的基础上,研究现象间的数量变化规律 。 (二)回归分析与相关分析的关系 (1)相关分析中,变量 x 变量 y 处于平等的地位,毋需确定自变量、因变量,而回归分析必须区别。 (2)相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。 (3)相关分析主要是描述变量之间有无关系?密切程度如何?回归分析则进一步揭示变量 x 对变量 y 的影响大小,并可以由回归方程进行预测和控制。 问题:为什么要使残差的平方和最小,而不是残差和最小呢? (三)判定系数 当我们采用最小二乘法拟合了回归直线后,发现,并不是所有的数据点都落在了回归直线上。 各种符号 判定系数的计算 平均身高 回归:退回regression 1877年 弗朗西斯?高尔顿爵士 遗传学研究 回归线 回归分析的种类 一元回归 (简单回归) 多元回归 (复回归) 线性回归 非线性回归 一 元线性回归 按自变量的 个数分 ⒈ 按回归曲线的形态分 ⒉ 对于经验

文档评论(0)

ganqludp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档