第七讲相关与回归.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七讲相关与回归

一元线性回归模型 根据两个变量配合直线方程,再根据自变量推算因变量的变动的一种统计方法。 模型中,y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 ? 是随机变量;a和b称为模型的参数 一元线性回归方程 假定误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的x值,y 的期望值为: E(y)=a+bx 方程的图示是一条直线,因此也称为直线回归方程a是回归直线在 y 轴上的截距,是当x=0 时y 的期望值 b是直线的斜率,称为回归系数,表示当x 每变动一个单位时,y 的平均变动值 估计的回归方程 估计的回归方程是 式中: 是y的估计值; 表示在纵轴上的截距,也就是当x=0时,y的取值。 表示直线的斜率,又称为回归系数 和 的确定方法 最小二乘法的思想是:使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即 最小二乘法(图示) x y (xn , yn) (x1 , y1) ? ? ? ? ? ? ? ? ? (x2 , y2) (xi , yi) } ei = yi-yi ^ 月份 产量(千台) 单位成本(元/台) 1 2 3 4 5 6 2 3 4 3 4 5 73 72 71 73 69 68 例:某企业的产品产量和成本的资料如下: 估计方程的求法 【例】根据前例的数据,根据求解公式得 产量每增加1000台,直线方程告知单位成本平均下降1.82元。 一元线性回归方程的检验 离差平方和的分解 1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差来表示 离差平方和的分解(图示) x y y { } } ? 离差分解图 离差平方和的分解 (三个平方和的关系) 2. 两端平方后求和有 从图上看有 SST = SSR + SSE 总变差平方和 (SST) { 回归平方和 (SSR) { 残差平方和 (SSE) { 离差平方和的分解 (三个平方和的意义) 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 样本决定系数 (判定系数 r2 ) 回归平方和占总离差平方和的比例 反映回归直线的拟合程度 取值范围在 [ 0 , 1 ] 之间 r2 ?1,说明回归方程拟合的越好;r2?0,说明回归方程拟合的越差 判定系数等于相关系数的平方,即r2=(r)2 估计标准误差 Sy 1.实际观察值与回归估计值离差平方和的均方根 2.反映实际观察值在回归直线周围的分散状况 3.从另一个角度说明了回归直线的拟合程度 4.计算公式为 显著性检验 一是线性关系的检验; 二是回归系数的检验。 线性关系检验 A、提出假设: H0: 线性关系不显著 B、计算检验统计量: C、确定显著性水平?,并根据分子自由度1和分母自由度n-2找出临界值作出决策: 若 ,拒绝H0; 若 ,不能拒绝H0 回归系数的检验 A、H0: ; H1: . B、计算检验统计量: C、确定显著性水平?,并根据分子自由度1和分母自由度n-2找出临界值作出决策: 若 ,拒绝H0; 若 ,不能拒绝H0 回归方程的估计和预测 点估计 对于自变量 x 的一个给定值x0 ,根据回归方程得到因变量 y 的一个估计值. 计算机实现 案例1:使用趋势线进行回归分析 某建筑厂商投资了16块地址区,其造地面积不同,工程造价也各不相同。忽略其他因素的影响,建筑厂商认为造地面积和工程造价之间存在线性相关关系。具体数值如下。 地区编号 造地面积X(平方米) 工程造价Y(百万) 1 4840 412 2 4580 384 3 3280 250 4 3930 328 5 4287 358 6 4060 338 7 3702 308 8 5035 432 9 3215 240 10

文档评论(0)

sk386545 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档