第六章相关与回归分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(二)相关系数与估计标准误差的关系 数量关系: (三)、回归模型的检验 1、离差平方和的分解(方差分析ANOVA) 可以证明: 符号表示:TSS=RSS+ESS RSS误差平方和(剩余平方和) ESS回归平方和 TSS:离差平方总和 即:离差平方总和=误差平方和(剩余平方和)+回归平方和 RSS反映了观测值偏离回归直线的程度。 ESS反映了回归值的离散程度。 一元线性(单因素)方差分析 n为样本观测值数目;对于给定的显著性水平?,查表F( ?,1,n-2), 如果F≥ F( ?,1,n-2),则认为X与Y存在线性相关关系,否则则拒绝。 2、回归标准误差 变量Y各观测值与回归直线的绝对离差数额----回归标准误差。 定义: 称为最小二乘回归的标准误差。 总体回归值的区间为: 回归线 原数列 3、回归系数的显著性检验 即验证变量X,Y是否有“真实的”线性关系,即??0。 根据 计算统计量: Sb是回归系数b的标准差.。 根据给定的显著水平和自由度(n-2)查t分布表得到临界值 ,若 则表明?=0的可能性小于5%,即可认为??0。 对?和 ?的区间估计 以样本指标值b对总体指标值?进行区间估计,?的区间为: 同样?的估计区间为 T分布表 4、回归方程的显著性检验 计算方程的F统计量 对一元线性方程有:A=ESS,B=RSS/(n-2),F=A/B 根据给定的显著水平和自由度(df1=1,df2=n-2)查F分布表得到临界值 F?,若 F F? ,则意味着方程中的一次项是不可缺少的,X与Y存在真实的线性关系。 在一元回归中,F检验和t检验结果相同。 F分布表 5、拟合优度检验:r2=ESS/TSS 检验回归直线在多大程度上减少了整个误差TSS。 r2=1表示RSS(误差平方和)全部被去掉,即Y与回归方程完全拟合,没有误差。 r2=0,说明回归直线与 完全拟合,RSS没有减少。 r2=99%,说明RSS减少了99%,拟合优度高。 为了摆脱拟合优度对自由度的依赖,还计算修正的r2: 其值越大越好,一般要求≥80%。 在一元线性回归中, 拟合优度和线性相关系数描述了回归直线对样本数据点的拟合程度(以百分数表示)。 6、D·W检验 回归模型假设条件要求随机项?独立。 这一假设可通过回归模型的误差(也称为残差)序列是否相互独立来进行检验。 D·W检验是检验ε之间是否有序列相关。 构造残差序列的d统计量(D.W.值): 根据给定的显著性水平α,自变量的个数K和样本的个数n,查D.W.表,从而得到下限值dl和du,然后看d落在哪一个区间。 0 dl du 2 4-du 4-dl 4 正自相关 不确定 无自相关 不确定 负自相关 Durbin-Watson d统计量α=0.05 即du DW 4-du,即1.4DW2.6为基本通过。 K’=k-1即等于自变量个数减1. 一般说来,导致残差序列自相关的原因有: 1、选择数学模型不合适,变量间不是线性关系。 2、模型中包含的自变量数目不合适,或遗漏了重要影响因素或包含了不必要因素。 3、序列包含很强的趋势分量。这时,常采用差分方法进行补救。时间序列常常有自相关现象。 一阶差分方程 原回归方程: 一阶差分方程: 其中: 如果Y在考虑了所有因素之外,自身存在上升趋势,则设方程为: 差分方程: 变为有截距的回归方程. 例题 例题1、见Sheet1 例题2、若居民收入以每年4.5%的速度递增,利用回归方程预测1990年的需求。 即在给定X的条件下,求相应的应变量Y的估计值。 A、点估计:把X带入回归方程,Y值为估计值。 B、区间估计: (二)模型的检验 1、回归系数的显著性检验 步骤与一元线性回归相同。只是查t分布表时,自由度应是n-k-1(k为自变量的个数)。 如果t检验通不过,可能是由于: a、该系数对应的自变量对应变量的影响不显著。(则去处该自变量) b、自变量之间高度相关而具有多重共线性。 共线性的测定与解决: 测定: 两个自变量情况下,共线性由两个自变量间的简单相关系数测定; 自变量两个以上时,共线性由每个自变量与其他自变量间的多重相关系数测定。 复相关系数 多重共线性的解决: 1)从模型中去除一个或几个自变量; 2)增大样本容量; 3)调换样本数据; 4)作一阶差分处理. 5)修改最小二乘法。 2、回归方程的显著性检验 多元回归中,t检验和F检验不等价。 计算F统计量: 根据给定

文档评论(0)

别拿青春赌明天 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档