- 5
- 0
- 约1.19万字
- 约 110页
- 2018-02-05 发布于浙江
- 举报
由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。 要缩小置信区间,需要 增大样本容量n。因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小; 提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和越小。 * * §2.5 一元线性回归分析的应用:预测问题 一、预测值条件均值或个值的一个无偏估计 二、总体条件均值与个值预测值的置信区间 * * 对于一元线性回归模型 给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值?0 ,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。 严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因: 参数估计量不确定; 随机项的影响。 说 明 * * 一、预测值是条件均值或个值的一个无偏估计 * * 1、?0是条件均值E(Y|X=X0)的无偏估计 对总体回归函数E(Y|X=X0)=?0+?1X,X=X0时 E(Y|X=X0)=?0+?1X0 可见,?0是条件均值E(Y|X=X0)的无偏估计。 * * 2、?0是个值Y0的无偏估计 对总体回归模型Y=?0+?1X+?,当X=X0时 可见,?0是个值Y0的无偏估计。 * * 二、总体条件均值与个值预测值的置信区间 * * 1、总体均值预测值的置信区间 * * * * 于是,在1-?的置信度下,总体均值E(Y|X0)的置信区间为 * * 2、总体个值预测值的预测区间 从而在1-?的置信度下,Y0的置信区间为 * * 3、例题—收入-消费支出 样本回归函数为 则在 X0=1000处,?0 = 142.4+0.670×1000=812.4 因此,总体均值E(Y|X=1000)的95%的置信区间为: ( 812.4-2.306?27.6,812.4+2.306?27.6) (748.8, 875.9) * * 同样地,对于Y在X=1000的个体值,其95%的置信区间为: (812.4 - 2.306?59.1,812.4 + 2.306?59.1) (676.1, 948.7) * * §2.6 实例及时间序列问题 * * 说明 本节列举了两个一元线性回归模型实例,完成了建立模型、估计参数、统计检验和预测的过程。 适合于课堂演示或者由学生在计算机上完成。 从理论上讲,经典线性回归模型理论是以随机抽样的截面数据或者平稳的时间序列数据为基础的。对于非平稳时间序列数据,存在理论方法方面的障碍。如何处理?本书第8章将专门讨论。在2—7章中大量采用非平稳时间序列数据作为实例,暂时不考虑理论方法方面的障碍。 * * 当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质(asymptotic properties): 渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值; 一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值; 渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。 * * 2、高斯—马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。 下面分别对最小二乘估计量的线性性、无偏性和有效性进行证明,作为不熟悉的同学的自学内容。★ * * * * 证: 易知 故 同样地,容易得出 * * * * (2)证明最小方差性 其中,ci=ki+di,di为不全为零的常数 则容易证明 * * 由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。 * * 四、参数估计量的概率分布及随机干扰项方差的估计 * * 1、参数估计量的概率分布 * * 2、随机误差项?的方差?2的估计 ?2又称为总体方差。 由于随机项?i不可观测,只能从?i的估计——残差ei出发,对总体方差进行估计。 可以证明,?2的最小二乘估计量为: 它是关于?2的无偏估计量。 * * 在最大或然估计法中,求解似然方程: ?2的最大或然估计量不具无偏性,但却具有一致性。 * * §2.4 一元线性回归模型的统计检验Statistical Test of Simple Linear Regression Model 一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间 * * 说 明 回归分析是要通过样本所估计的参数来代替
原创力文档

文档评论(0)