2.4 元线性回归.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.4 元线性回归

§2.4 一元线性回归模型的统计检验 预备知识:自由度的概念 一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间 例如,测量学生的身高X,如某班有40名学生,则X可以得到 40个值,自由度为40;但是如已知平均身高,那么得到39名的身高后,最后一名的身高就确定了,自由度减少一个,为40-1=39。 其公式为:自由度=变量个数-方程个数 残差平方和的自由度:n-k-1 一、拟合优度检验 拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。 度量拟合优度的指标:判定系数(可决系数)R2 二、变量的显著性检验 回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。 在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。 1、假设检验 所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。 假设检验采用的逻辑推理方法是反证法。 先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。 判断结果合理与否,是基于“小概率事件不易发生”这一原理的 用 P 值判断参数的显著性 假设检验的 p 值: p 值是根据既定的样本数据所计算的统计量, 拒绝原假设的最小显著性水平。 统计分析软件中通常都给出了检验的 p 值。 §2.5 一元线性回归分析的应用:预测问题 一、?0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计 二、总体条件均值与个值预测值的置信区间 §2.6 实例及时间序列问题 一、中国城镇居民人均消费支出模型:截面数据模型 二、中国居民总量消费函数:时间序列模型 三、时间序列问题 三、时间序列问题 上述实例表明,时间序列完全可以进行类似于截面数据的回归分析。 然而,在时间序列回归分析中,有两个需注意的问题: 第一,关于抽样分布的理解问题。 能把表2.6.1中的数据理解为是从某个总体中抽出的一个样本吗? 因此 故 其中 于是,在1-?的置信度下,总体均值E(Y|X0)的置信区间为 2、总体个值预测值的预测区间 由 Y0=?0+?1X0+? 知: 于是 式中 : 从而在1-?的置信度下, Y0的置信区间为 在上述收入-消费支出例中,得到的样本回归函数为 则在 X0=1000处, ?0 = –103.172+0.777×1000=673.84 而 因此,总体均值E(Y|X=1000)的95%的置信区间为: 673.84-2.306?61.05 E(Y|X=1000) 673.84+2.306?61.05 或 (533.05, 814.62) 同样地,对于Y在X=1000的个体值,其95%的置信区间为: 673.84 - 2.306?61.05Yx=1000 673.84 + 2.306?61.05 或 (372.03, 975.65) 总体回归函数的置信带(域)(confidence band) 个体的置信带(域) 对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间): (1)样本容量n越大,预测精度越高,反之预测精度越低; (2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。 * 受限制的个数 df=多少?并说明 df=多少?并说明 自由度:表示方程中能够自由变动的变量个数 例: 将p31页公式(2.2.3);p59公式(3.2.3)可以转化为下面形式 方程个数k+1 注意:凡是涉及到残差构成的统计量,自由度就会减少k+1个,例如显著性检验中的t检验和f检验的自由度等。 回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。 尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。 主要包括拟合优度检验、变量的显著性检验及参数的区间估计。 问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档