第二章双变量回归的进一步讨论.pptVIP

  • 10
  • 0
  • 约4.75千字
  • 约 33页
  • 2017-04-24 发布于四川
  • 举报
第二章双变量回归的进一步讨论

第二章 双变量回归的进一步讨论;1. 正态性假设;我们的目标并不仅仅是得到 ,而是要利用它对其真值 作出论断。更一般的来说,我们的目的不仅是要得到样本回归函数(SRF),而是要用它来推测总体回归函数(PRF)。 那么,我们为什么必须对干扰项ui的概率分布进行进一步的假定呢?事实上,我们在前面的分析中已经强调过,最小二乘(OLS)估计量 都是ui的线性函数,因此最小二乘(OLS)估计量 的概率分布是依赖于ui的概率分布的。 在回归分析中,人们常常愿意假设ui是遵循正态分布的,这种假设是有理由的,我们稍后来证明。 我们把假定了干扰ui符合正态分布的模型称为双变量经典正态线性回归模型(CNLRM)。;1.2 正态性假设 经典正态线性回归假定每个ui都是正态分布的,且: 顺便指出,对两个正态分布变量来说,零协方差或零相关就意味着这两个变量是互相独立的。;ui符合正态分布的解释: 1. ui代表了回归模型中未作为自变量引入的,而对因变量产生影响的其他因素的总和。我们希望这些被忽略的变量的影响是微小的,而且充其量是随机的。利用中心极限定理可以证明,如果存在大量的独立且同分布的随机变量,随着这些变量的数量的无限增大,它们的总和将趋于正态分布。 中心极限定理也说明,即便变量的个数是有限的,且不是严格独立的,它们的总和也可以看做是服从正态分布的。 正态分布的一个基本性质是:正态分布变量的任何线性函数都是正态分布的。这样最小二乘估计量 也都是正态分布的。 最后,正态分布是一种简单的,我们熟知的分布。;1.3 在正态性假设下OLS估计量的性质 在正态性假设下,OLS估计量 有如下统计性质: 1. 它们是无偏的。 2. 它们有最小方差。 3. 一致性。随样本含量无限地增大,估计量将收敛到它们的真值。 4. 是正态分布的。 5. 服从n-2个自由度的 分布。 6. 的分布独立于 。 7. 是最优无偏估计量(BLUE)。 ; 是正态分布的; 是正态分布的;1.3 与正态分布有关的一些概率分布 t分布、CHI分布和F分布与正态???布有着密切关系,在统计推断中被大量的使用。以下以定理的形式将其关系概括,证明请参阅相关文献。;;;2.区间估计和假设检验;我们试求两个正数δ和α, α位于0和1之间,使得随机区间 包含β2的的概率为1- α。用符号来表示: 如果这个区间存在,就称之为置信区间; 1- α称为置信系数;而α称显著性水平;置信区间的端点分别称为置信下限和置信上限。 注意: (1)上式并没有说β2落在给定区域的概率是1- α,因为β2虽然未知,但是一个确定的数,它落在固定区域的可能性只有1或者0。 (2)因为 是随机的,而置信区域是根据 来构造的,因此置信区域也是随机的。 (3)因此,我们说如果重复多次,那么从长期来看,平均的说,这些区域将有1- α次包含着参数的真值。;2.2 回归参数β1和β2的置信区域 β2的置信区域 在ui的正态假设下,OLS估计量 本身就是正态分布,因此构造一个随机变量: 这是一个标准化的正态分布变量。当δ2已知,以μ为均值的正态分布有着良好的性质:正态曲线下μ±δ之间的面积约占68%;在μ±2δ之间的面积约占95%;在μ±3δ之间的面积约占99.7%。 但是δ2我们不知道,在实践中用无偏估计量 来测定。;构造一个随机变量: 这样定义的随机变量t是遵循自由度为n-2(因为先要估算 ,所以丧失了2个自由度)的t分布(利用定理5)。 在前面例子中, =0.5091,se( )=0.0357,自由度为8。若取α=5%, 查表tα/2=t0.025=2.306,将这些值带入到上式中得到β2的95%置信区间为: 0.4268 ≤ β2 ≤0.5914;δ2的置信区域 在正态假设下,构建一个随机变量: 遵循自由度为n-2的χ2分布。 ;回到原来的例子:;2.3 假设检验:概述 假设检验问题可以简单概述如下:问某一给定的观测值或发现是否与某声明的假设(stated hypothesis)相符(compatible)?这里用相符一词来表示与假设值“足够接近”,因而我们不拒绝所声称的假设。 用统计语言来说,这个声称的假设叫做虚拟

文档评论(0)

1亿VIP精品文档

相关文档