第七章 相关与回归分析44598.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 相关与回归分析44598.ppt

学习目的: (1)掌握相关分析与相关系数的概念、相关系 数的计算方法 (2)掌握一元线性回归的基本原理和参数的最小二乘 估计方法 (3)掌握回归方程的显著性检验 (4)利用回归方程进行预测 重点:(1)相关系数; (2)一元线性回归的基本原理。 难点:(1)相关系数的计算方法; (2)回归方程的显著性检验。 父亲们的身高与儿子们的身高之间 关系的研究 1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录 企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式 下图是根据1078个家庭的调查所作的散点图(略图) 从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下: 如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”——见1889年F.Gallton的论文《普用回归定律》。 后人将此种方法普遍用于寻找变量之间的规律 (一)建立一元线性回归方程的步骤 散点图 计算公式 回归分析的内容和步骤 1、根据理论和对问题的分析判断, 区分自变量和因变量; 2、设法找出适合的数学方程式(即 回归模型)描述变量间的关系 3、对回归模型进行统计检验; 4、统计检验通过后,利用回归模型,根据解释变量去估计,预测 因变量。 回归分析的分类 根据变量的多少分为: 简单回归 多元回归 只有一个自变量和一个因变量的回归 自变量数目在两个或两个以上 根据建立的回归模型形式分为: 线性回归 非线性回归 从所拟合的回归模型来看,一变量表现为其它变量的线性组合。 从所拟合的回归模型来看,一变量表现为其它变量的非线性组合 回归分析与相关分析 理论和方法具有一致性; 无相关就无回归,相关程度越高,回归越好; 相关系数和回归系数方向一致,可以互相推算。 联系: 相关分析中x与y对等,回归分析中x与y要确定自变量和因变量; 相关分析中x、y均为随机变量,回归分析中只有y为随机变量; 相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。 回归分析与相关分析 区别: 简单线性回归模型 指根据成对的两个变量的数值,配合直线方程式,根据自变量的变动,来推算因变量发展变动趋势的方法,其模型为: 其中:Yi表示因变量Y在总体中某一个具体的观察值;Xi表示在研究总体中自变量X的具体观察数值;A与B是参数,称为回归系数;εi是一个随机变量,其平均数为0,方差为σ2. 总体回归模型 总体一元线性回归模型: 模型参数 误差项 假定: E(?)=0 总体一元线性回归方程: 简单线性回归模型的假设 1、正态性假定 3、线性假定 2、同方差假定 4、独立性假定 当确定某一个Xi时,相应的Y就有许多Yi值与之对应。Yi是一个随机变量,这些Yi构成一个在X取值为Xi条件下的条件分布、并假设其服从正态分布。 假定所有Yi这一条件分布的方差是相等的。 假定所有Yi这一条件分布的平均数位于一条直线上,这条直线为Yi=A+BX, 假定Yi之间是独立的,也就是说抽样时,Y的值在每取一个X值的条件分布相互独立。 一元线性回归模型的假定 在实际应用中,我们对X和Y所代表的总体往往不可能全面的观察和了解,而只能从中抽取部分资料作为样本,并通过样本提供的信息来认识总体,找出总体回归模型的估计式,其估计式的方程式可写为: 简单线性回归模型 其中:a,b和ei分别为A、B及εi的估计量。 由于抽样的随机性,使样本回归线不可能与总体回归完全重合,从而会出现样本回归函数高估或低估总体回归函数的情况,我们能做的就是设法使样本回归函数尽可能接近总体回归函数,也就是说要使回归方程参数的估计值a、b尽量接近总体真实参数A、B。 样本回归模型 一元线性回归方程的几何意义 截距 斜率 一元线性回归方程的可能形态 ?为正 ?为负 ?为0 回归直线的拟合 总体一元线性 回归方程: 样本一元线性回归方程: 以样本统计量估计总体参数 斜率(回归系数) 截距 截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。 (估计的回归方程) 随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响 X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。 残差(Residual):e 1、作散点图 2、配直线方程 一元线性回归方程 中参数a、b的确定: 最小平方法 基本数学要求 整理得到由两个关于a、b的二元一次方程组成的方程组: 进一步整

文档评论(0)

cai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档