- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2011管理统计二元选择模型和受限因变量讲解
离散因变量模型 我们经常会遇到被解释变量的取值是离散的,分类的或者顺序的情形。 本节讲述离散因变量模型中最简单的一种——二元选择模型 一、二元选择模型 很多现象都可以用二元变量描述 学生是否选择某选修课程,选或者不选 消费者对某种商品的选择,买或者不买 农民是否加入合作医疗保险,加入或者不加入 模型框架 随机变量形式 二元选择模型的目的:考察X对于观察到y=1的概率的影响。 Y的条件期望就是y=1的概率 因此二元选择模型又被称为概率模型 二、线性概率模型 1、线性概率模型: 例如,研究居民的收入和是否购买住房的关系 看上去和OLS回归一样,区别是Y只取0和1两个值。 线性概率模型的特点 随机扰动项的分布 随机扰动项不服从正态分布。对于参数估计不会产生影响,但会影响统计推断。只有大样本情况下,才可以利用正态分布假定进行统计推断。 线性概率模型评价 优点: 计算简单,结果易于解释 缺点: 预测概率值可能落在[0,1]之外。 线性概率模型假定自变量Y=1的概率之间存在线性关系,而实际往往不是线性的。 解决:假设负的拟合值为0,大于1的拟合值为1. 随机误差项不是正态分布 随机误差项具有异方差。 方差为p(1-p),而P是Y=1的概率,此概率对不同观测值不同。 二、非线性概率模型 实际上,p与x 可能是非线性关系。 随着X的增加,P(y=1)的概率在增加,但不超过[0,1] P和x的关系是非线性的.随着x变小,p趋向0的速度越慢。随着x变大,p趋向1的速度也越慢。 怎样的函数有这个特性? 分布函数 1、Probit模型 分布函数取标准正态分布。 称为Probit模型或者概率单位模型 利用极大似然估计方法求解 参数的含义 可以证明,x对y=1的概率的边际影响为 可见,系数本身并不是边际影响,边际影响也不是常数。但和边际影响的符号相同。 2、Logit模型 随机扰动项去Logistic分布, 称为Logit模型 利用极大似然估计方法求解 参数的含义 机会比: 3、非线性模型的拟合优度 不再使用 常用三个指标 Pseudo-R2 概率的正确预测率 检查Y=1或0的概率的正确性,判断拟合的好坏 预测值与真实值的相关系数 相关系数高,表明拟合越好 4、模型的选择 直接比较三种概率模型的系数是没有意义的 线性概率模型可用于问题的初步分析 Logit模型,系数含义可以通过机会比得以解释,可以扩展到多元选择模型 Probit模型,可由随机变量服从正态分布的假定得到,可以扩展到Tobit 模型 受限因变量模型 现实的经济活动中,有时会遇到被解释变量Y不能被完全观察的情形。 审查回归模型,归并数据模型,截取回归模型(censored regression models) 截断回归模型,断尾回归模型(truncated regression models) 一、归并数据(Censeored Data) 1、什么是censored数据 当被解释变量的取值被限定在一个特定的范围时,就出现数据截取。 2、censored数据的分类 (1)上截取(右截取) 如果Y*大于某值(如C),我们只能观察到y=c. 考虑潜变量模型 被观察数据y与潜变量 的关系 例如,在电影或者球赛的门票销售中,由于受到场地的限制,门票的需求量超过了座位数C时,我们只能观察到Y=C。 (2)下截取(左截取) 定义类似于上截取模型。一个特殊的下截取模型,TOBIT模型 例1,研究人们在一个月中酒方面的花费就是一个例子。有相当多的人在酒方面的花费为零。我们不是简单的将这些观测从样本中去掉,而是建立Tobit模型。 ?例2,在耐用消费品的选择中,如果最优消费数量 小于1,消费者就会选择不买,此时就观察到0。此时不是简单的将这类观测从样本中去掉,而是建立TObit模型 3、产生截取的原因 角点解(如上例) 数据分类:例如对数据进行分类整理时,把低于某个下限或高于某个上限的数值用下限或者上限代替,从而产生截取。例如在收入调查时“高于两万元”这样的选项,上截取 二、Censored模型(截取模型,审查回归模型) 1、Censored模型——以Tobit 模型为例 一类重要的Censored模型,在严格为正时大致连续,但总体中总有一个不可忽略的部分取值为0. 例如,某人在一个月中酒方面的花费就是一个例子。有相当多的人在酒方面的花费为零。我们不是简单的将这些观测从样本中去掉,而是建立Tobit模型。 考虑潜变量回归模型 其中Y*为潜变量,u满足经典回归模型的基本假设, 2、TOBIT模型的估计 利用最大似然方法,可进行估计。 得到参数? , ? 的估计 3、TO
文档评论(0)