第二章双变量回归的进一步讨论.pptVIP

下载本文档

10
0
约4.75千字
约 33页
2017-04-24 发布于四川
举报

第二章双变量回归的进一步讨论.ppt

第二章双变量回归的进一步讨论

第二章双变量回归的进一步讨论;1. 正态性假设;我们的目标并不仅仅是得到，而是要利用它对其真值作出论断。更一般的来说，我们的目的不仅是要得到样本回归函数（SRF），而是要用它来推测总体回归函数（PRF）。那么，我们为什么必须对干扰项ui的概率分布进行进一步的假定呢？事实上，我们在前面的分析中已经强调过，最小二乘（OLS）估计量都是ui的线性函数，因此最小二乘（OLS）估计量的概率分布是依赖于ui的概率分布的。在回归分析中，人们常常愿意假设ui是遵循正态分布的，这种假设是有理由的，我们稍后来证明。我们把假定了干扰ui符合正态分布的模型称为双变量经典正态线性回归模型（CNLRM）。;1.2 正态性假设经典正态线性回归假定每个ui都是正态分布的，且：顺便指出，对两个正态分布变量来说，零协方差或零相关就意味着这两个变量是互相独立的。;ui符合正态分布的解释： 1. ui代表了回归模型中未作为自变量引入的，而对因变量产生影响的其他因素的总和。我们希望这些被忽略的变量的影响是微小的，而且充其量是随机的。利用中心极限定理可以证明，如果存在大量的独立且同分布的随机变量，随着这些变量的数量的无限增大，它们的总和将趋于正态分布。中心极限定理也说明，即便变量的个数是有限的，且不是严格独立的，它们的总和也可以看做是服从正态分布的。正态分布的一个基本性质是：正态分布变量的任何线性函数都是正态分布的。这样最小二乘估计量也都是正态分布的。最后，正态分布是一种简单的，我们熟知的分布。;1.3 在正态性假设下OLS估计量的性质在正态性假设下，OLS估计量有如下统计性质： 1. 它们是无偏的。 2. 它们有最小方差。 3. 一致性。随样本含量无限地增大，估计量将收敛到它们的真值。 4. 是正态分布的。 5. 服从n-2个自由度的分布。 6. 的分布独立于。 7. 是最优无偏估计量（BLUE）。 ; 是正态分布的; 是正态分布的;1.3 与正态分布有关的一些概率分布 t分布、CHI分布和F分布与正态???布有着密切关系，在统计推断中被大量的使用。以下以定理的形式将其关系概括，证明请参阅相关文献。;;;2.区间估计和假设检验;我们试求两个正数δ和α， α位于0和1之间，使得随机区间包含β2的的概率为1- α。用符号来表示：如果这个区间存在，就称之为置信区间； 1- α称为置信系数；而α称显著性水平；置信区间的端点分别称为置信下限和置信上限。注意：（1）上式并没有说β2落在给定区域的概率是1- α，因为β2虽然未知，但是一个确定的数，它落在固定区域的可能性只有1或者0。（2）因为是随机的，而置信区域是根据来构造的，因此置信区域也是随机的。（3）因此，我们说如果重复多次，那么从长期来看，平均的说，这些区域将有1- α次包含着参数的真值。;2.2 回归参数β1和β2的置信区域 β2的置信区域在ui的正态假设下，OLS估计量本身就是正态分布，因此构造一个随机变量：这是一个标准化的正态分布变量。当δ2已知，以μ为均值的正态分布有着良好的性质：正态曲线下μ±δ之间的面积约占68%；在μ±2δ之间的面积约占95%；在μ±3δ之间的面积约占99.7%。但是δ2我们不知道，在实践中用无偏估计量来测定。;构造一个随机变量：这样定义的随机变量t是遵循自由度为n-2（因为先要估算，所以丧失了2个自由度）的t分布(利用定理5)。在前面例子中， =0.5091，se( )=0.0357，自由度为8。若取α=5%，查表tα/2=t0.025=2.306,将这些值带入到上式中得到β2的95%置信区间为： 0.4268 ≤ β2 ≤0.5914;δ2的置信区域在正态假设下，构建一个随机变量：遵循自由度为n-2的χ2分布。 ;回到原来的例子：;2.3 假设检验：概述假设检验问题可以简单概述如下：问某一给定的观测值或发现是否与某声明的假设（stated hypothesis）相符（compatible）？这里用相符一词来表示与假设值“足够接近”，因而我们不拒绝所声称的假设。用统计语言来说，这个声称的假设叫做虚拟

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第二章双变量回归的进一步讨论.pptVIP