第2章 2.3简单线性回归模型的统计检验.ppt

第2章 2.3简单线性回归模型的统计检验.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 2.3简单线性回归模型的统计检验

第三节 拟合优度的度量 1、拟合优度检验 拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。 度量拟合优度的指标:判定系数(可决系数)R2 第四节 回归系数的区间估计和假设检验 一、OLS估计的分布性质 二、回归系数的区间估计 三、回归系数的假设检验 三、回归系数的假设检验 回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。 在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。 1、什么是假设检验 所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。 假设检验采用的逻辑推理方法是反证法。 先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,利用适当的符合某种概率分布的统计量和给定的显著性水平,构造一个小概率事件,如果小概率事件发生,说明原假设不正确,就拒绝原假设。 假设检验的过程 (提出假设→抽取样本→作出决策) t统计量25.52临界值2.306,就拒绝原假设,说明家庭消费支出对家庭可支配收入的回归系数是显著的 案例分析:中国城市居民消费支出 第五节 回归模型预测 eviews应用软件中的广义差分法 在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计?。 在解释变量中引入AR(1)、AR(2)、…,即可得到参数和ρ1、ρ2、…的估计值。 其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了ρ1、ρ2、…的迭代。 案例2:用回归模型预测木材剩余物 伊春林区位于黑龙江省东北部。全区有森林面积 218.9732万公顷,木材蓄积量为2.324602亿m3。森林覆盖 率为62.5%,是我国主要的木材工业基地之一。1999年伊 春林区木材采伐量为532万m3。按此速度44年之后,1999 年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规 划与方式,保护森林生态环境。为缓解森林资源危机,并 解决部分职工就业问题,除了做好木材的深加工外,还要 充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板 等。因此预测林区的年木材剩余物是安排木材剩余物加工 生产的一个关键环节。下面,利用一元线性回归模型预测 林区每年的木材剩余物。显然引起木材剩余物变化的关键 因素是年木材采伐量。 t t0.05/2=2.306 3.16 t0.01/2=3.25 P(t2.306)=0.0000 第五节 回归模型预测 1、对Y0平均值的点预测 总体回归函数 当人均收入Xi=8000时,人均消费 2、对Y0平均值预测的置信区间 由于 于是 回归分析表解释: 其中 于是,在1-?的置信度下,总体均值E(Y|X0)的置信区间为 3、对Y0总体个值的预测区间 由 Y0=?0+?1X0+? 知: 于是 式中 : 从而在1-?的置信度下, Y0的置信区间为 在收入-消费支出例中,得到的样本回归函数为 则在 X0=1000处, ?0 = –103.172+0.777×1000=673.84 而 因此,总体均值E(Y|X=1000)的95%的置信区间为: 673.84-2.306?61.05 E(Y|X=1000) 673.84+2.306?61.05 或 (533.05, 814.62) 同样地,对于Y在X=1000的个体值,其95%的置信区间为: 673.84 - 2.306?130.87Yx=1000 673.84 + 2.306?130.87 或 (372.03, 975.65) 总体回归函数的置信带(域)(confidence band) 个体的置信带(域) 对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间): (1)样本容量n越大,预测精度越高,反之预测精度越低; (2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。 * 问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度? 2、总离差平方和的分解 已知由一组样本观测值(Xi,Yi),i=1,2…,n得到如下样本回归直线 如果Yi=?i 即实际观测值落在样本回

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档