大数据计量经济分析课件第6章离散与受限因变量回归模型.pptx

下载文档

1
0
约5.92千字
约 49页
2025-06-25 发布于山东
举报
版权申诉
保障服务

大数据计量经济分析课件第6章离散与受限因变量回归模型.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第6章离散与受限因变量模型1

第6章离散与受限因变量模型本章主要内容线性概率模型Logit模型Probit模型Tobit模型2

6.1线性概率模型3

6.1.1线性概率模型的定义对于二元选择问题，一种最简单的分析方法是不加任何特殊处理而直接使用普通线性回归模型的设定：是取值为0或1的虚拟因变量，一般设为：对模型两边取条件期望得：4

6.1.1线性概率模型的定义的条件分布如表所示：的条件期望值为：5取值概率10在线性概率模型中，只能取两个值，0或1，所以不能把斜率系数解释为X的单位变动引起Y的条件均值的变化，可以解释为X单位变动引起的Y=1概率的变化。以为例，说明每增加一个单位，则第一种选择发生的概率增加0.05。

6.1.2线性概率模型的估计1.随机误差项是非正态分布的线性概率模型中的随机误差项不服从正态分布，对参数估计并不产生影响，OLS法本身并不要求服从正态分布，即OLS估计量在非正态分布条件下依然是最优线性无偏估计量。6服从二项分布

6.1.2线性概率模型的估计2.随机误差项存在异方差性随机误差项的方差是的条件期望的函数，是异方差的。此时，OLS估计量将不再是最小方差的，统计检验也是不可靠的。要消除异方差的影响，可使用加权最小二乘法进行参数估计。7

6.1.2线性概率模型的估计3.无法保证Y的估计值介于0和1之间线性概率模型的不能保证在0和1之间，可能大于1，也可能小于0。这是线性概率模型用OLS法估计存在的核心问题之一。8

6.1.2线性概率模型的估计【例6-1基于线性概率模型的员工离职影响因素分析】1.变量介绍9?变量名变量定义具体说明因变量是否离职1：离职；0：未离职??自变量年龄年龄出差频率1：经常出差；0：很少出差距离单位与住处之间的实际距离（公里）?工作满意度从1到4，1代表满意程度最低，4代表满意程度最高?婚否1：已婚；0：未婚

6.1.2线性概率模型的估计2.模型构建本例的因变量label只有离职和未离职两种结果，可以构建线性概率模型，具体形式为：3.参数估计与假设检验10

6.1.2线性概率模型的估计从估计结果可以看出，所有自变量参数估计量的t值均大于临界值,表明各自变量的斜率系数在5%显著水平下显著不为零，即职工年龄、出差频率、单位与住处之间的距离、工作满意度和婚姻状况等因素对离职的概率都有显著影响。在其他条件不变的情况下，年龄每增加1岁，离职概率平均下降0.007；经常出差的职工离职概率比不经常出差的职工平均高出0.070；单位与住处之间的距离每增加1公里，离职概率平均增加0.004；工作满意度每提高一个级别，离职概率平均下降0.042；已婚职工的离职概率比未婚职工平均低0.060。11

6.2Logit模型12

13由于线性概率模型存在一些问题，希望能找到一种变换方法，（1）使解释变量xi所对应的所有预测值（概率值）都落在（0，1）之间。（2）同时对于所有的xi，当xi增加时，希望yi也单调增加或单调减少。显然累积概率分布函数F(zi)能满足这样的要求。采用累积正态概率分布函数的模型称作Probit模型。用正态分布的累积概率作为Probit模型的预测概率。另外logistic函数也能满足这样的要求。采用logistic函数的模型称作logit模型。

6.2.1Logit模型的基本形式Logit模型是一个离散选择模型，主要用来解决分类问题。该模型的因变量是取值为0或1的二元变量，自变量没有限制，虚拟变量或连续变量均可。其采用的是Logistic概率分布函数，基本形式为：其中，，F(?)为logistic累积概率分布函数，其分布规律如图6-2所示。15

6.2.2Logit模型的估计由于Logit模型属于非线性模型，我们不能用普通最小二乘法对其进行估计，一般用极大似然估计法。极大似然估计法的基本思想是希望通过确定模型的参数使该模型产生已知样本的概率最大。主要步骤如下：（1）依据对随机误差项的统计分布假定，计算单个样本的概率密度；（2）将所有样本的概率密度累乘得到样本的似然函数；（3）将似然函数进行对数转换，从而得到对数似然函数；（4）将对数似然函数最大化，求得参数的极大似然估计值。18

6.2.3Logit模型的边际效应边际效应是指自变量变动一个单位对因变量的影响。与线性概率模型不同，Logit模型中的系数β并不直接代表自变量X对于的边际效应