第六章-第七章: 一元线性回归模型.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回答:在一个特定的条件下做得最好的并不一定就是高质量的。 比方,假如你采用最好的学习方法学习计量经济学(该方法冠名为“普通最小二乘学习法”,可以保证你取得最好的考试成绩。但是这个最好成绩也有可能通过考核发现只有55分(不及格),但已经是你的最好成绩了;也有可能是99分,但不管怎样,要通过考核才知道这个对于你来说的最好成绩到底是多少分。 总之,对于你来说的最好成绩,不一定就是高分。 假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。 三、参数的置信区间 要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。 如果存在这样一个区间,称之为置信区间(confidence interval); 1-?称为置信系数(置信度)(confidence coefficient), ?称为显著性水平(level of significance);置信区间的端点称为置信限(confidence limit)或临界值(critical values)。 一元线性模型中,?i (i=1,2)的置信区间: 在变量的显著性检验中已经知道: 意味着,如果给定置信度(1-?),从分布表中查得自由度为(n-2)的临界值,那么t值处在(-t?/2, t?/2)的概率是(1-? )。表示为: 即 于是得到:(1-?)的置信度下, ?i的置信区间是 在上述收入-消费支出例中,如果给定? =0.01,查表得: 由于 于是,?1、?0的置信区间分别为: (0.6345,0.9195) (-433.32,226.98) 由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。 要缩小置信区间,需要 (1)增大样本容量n。因为在同样的置信水平下,n越大(自由度也越大),t分布表中的临界值越小(参照t分布表可知);同时,增大样本容量,还可使样本参数估计量的标准差减小; (2)提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。 §2.4 一元线性回归分析的应用:预测问题 一、?0是条件均值E(Y|X=X0) 的一个无偏估计 二、总体条件均值预测值的置信区间 表 2.1.3 家庭消费支出(Y)与可支配收入(X)的一个随机样本 X 8 00 1100 1400 1700 2000 2300 2600 2900 3200 3500 Y 594 638 1122 1155 1408 1595 1969 2078 2585 2530 在上述收入—消费支出例中,得到的样本回归函数为: 假设想要知道在 X0=1000处,家庭消费支出的平均水平,即E(Y|X0=1000)。 ?0 = –103.172+0.777×1000=673.84 但它不等于真实均值E(Y|X0=1000)。只是真实均值的一个近似估计。 为什么?因为 中的参数估计量是不确定的。 一、?0是条件均值E(Y|X=X0)的一个无偏估计 对总体回归函数E(Y|X=X0)=?0+?1X,X=X0时 E(Y|X=X0)=?0+?1X0 于是 可见,?0是条件均值E(Y|X=X0)的无偏估计。 二、总体条件均值预测值的置信区间 由于 可以证明 Var(?0 ) 故 于是,在1-?的置信度下,总体均值E(Y|X0)的置信区间为 其中 在上述收入—消费支出例中,得到的样本回归函数为: 则在 X0=1000处, ?0 = –103.172+0.777×1000=673.84 这个673.84仅仅是E(Y|X=1000)的一个点估计值。 而 因此,总体均值E(Y|X=1000)的95%的置信区间为: 673.84-2.306?61.05 E(Y|X=1000) 673.84+2.306?61.05 或 (533.05, 814.62) 在样本之外的一个观察值X=1000处,我们要预测的真实均值E(Y|X=1000)以95%的置信度落在区间(533.05,

文档评论(0)

hy235999 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档