第十章定性选择模型(计量经济学,潘省初).pptxVIP

  • 3
  • 0
  • 约7.65千字
  • 约 46页
  • 2023-01-08 发布于云南
  • 举报

第十章定性选择模型(计量经济学,潘省初).pptx

第十章 定性选择模型; 我们在第四章中曾介绍解释变量为虚拟变量的模型,本章要讨论的是因变量为虚拟变量的情形。在这种模型中,因变量描述的是特征、选择或者种类等不能定量化的东西,如乘公交还是自己开车去上班、考不考研究生等。在这些情况下,因变量是定性变量,我们可以用定义虚拟变量的方法来刻画它们。这种因变量为虚拟变量的模型被称为定性选择模型(Qualitative choice models)或定性响应模型(Qualitative response models)。 如果只有两个选择,我们可用0和1 分别表示它们,如乘公交为0,自驾车为1,这样的模型称为二元选择模型(binary choice Models),多于两个选择(如上班方式加上一种骑自行车)的定性选择模型称为多项选择模型(Multinomial choice models)。 ;第一节 线性概率模型 二元选择模型如何估计呢?由于它看上去象是一个典型的OLS回归模型,因而一个简单的想法是采用OLS法估计。当然,对结果的解释与常规线性回归模型不同,因为二元选择模型中因变量只能取两个预定的值。线性概率模型(LPM)一般形式如下: 这看上去与典型的OLS回归模型并无两样,但区别是这里Y只取0和1两个值,观测值可以是个人、公司、国家或任何其他横截面个体所作的决定。解释变量中可以包括正常变量和虚拟变量。; 下面用一个关于是否读研究生的例子来说明如何解释线性概率模型的结果。模型为:; 设回归结果如下(所有系数值均在10%水平统计上显著): ; 尽管因变量在这个二元选择模型中只能取两个值:0或1,可是该学生的的拟合值或预测值为0.8。我们将该拟合值解释为该生决定读研的概率的估计值。因此,该生决定读研的可能性或概率的估计值为0.8。需要注意的是,这种概率不是我们能观测到的数字,能观测的是读研还是不读研的决定。 对斜率系数的解释也不同了。在常规回归中,斜率系数代表的是其他解释变量不变的情况下,该解释变量的单位变动引起的因变量的变动。而在线性概率模型中,斜率系数表示其他解释变量不变的情况下,该解释变量的单位变动引起的因变量等??1的概率的变动。; GPA的系数估计值0.4意味着家庭收入不变的情况下,一个学生的GPA增加一个点(如从3.0到4.0),该生决定去读研的概率的估计值增加0.4。 INCOME的系数估计值0.002说明,一个学生的成绩不变,而家庭收入增加1000美元,该生决定去读研的概率的估计值增加0.002。 LPM模型中,解释变量的变动与虚拟因变量值为1的概率线性相关,因而称为线性概率模型。;线性概率模型存在的问题 (1)线性概率模型假定自变量与Y=1的概率之间存在线性关系,而此关系往往不是线性的。 (2)拟合值可能小于0或大于1,而概率值必须位于0和1的闭区间内。 回到有关读研的例子。假设学生乙的GPA为4.0,家庭收入为20万美元,则代入(10.3)式,Y的拟合值为 从而得到一个不可能的结果(概率值大于1)。假设另有一个学生丙的GPA为1.0,家庭收入为5万元,则其Y的拟合值为 -0.2,说明读研的概率为负数,这也是一个不可能的结果。; 解决此问题的一种方法是,令所有负拟合值都等于0,所有大于1的拟合值都等于1。但也无法令人十分满意,因为在现实中很少会有决策前某人读研的概率就等于1的情况,同样,尽管某些人成绩不是很好,但他去读研的时机仍会大于0。线性概率模型倾向于给出过多的极端结果:估计的概率等于0或1。 (3) 另一个问题是扰动项不是正态分布的。事实上,线性概率模型的扰动项服从二项分布。 (4)此外,线性概率模型存在异方差性。扰动项的方差是 ,这里 是因变量等于1的概率,此概率对于每个观测值不同,因而扰动项方差将不是常数,导致异方差性。可以使用WLS法,但不是很有效,并且将改变结果的含义。; (5)最后一个问题是在线性概率模型中, 以及 不再是适宜的拟合优度测度。事实上,此问题不仅是线性概率模型的问题,而是所有定性选择模型的问题。较好一点的测度是模型正确预测的观测值的百分比。首先,我们将每一预测归类为1或0。如果拟合值大于等于0.5,则认为因变量的预测值为1。若小于0.5,则认为因变量的预测值为0。然后,将这

文档评论(0)

1亿VIP精品文档

相关文档