- 799
- 0
- 约3.85千字
- 约 43页
- 2016-08-05 发布于浙江
- 举报
第17章 限值因变量模型和样本选择纠正
刘愿
提纲
二值响应的对数单位和概率单位模型
用于角点解响应的托宾模型
泊松回归模型
截取和断尾回归模型
样本选择纠正
二值响应的对数单位和概率单位模型
线性概率模型的缺陷:
--拟合值(概率)可能小于0或大于1;
--任何一个解释变量(以水平值形式出现)的偏效应都是不变的。
二值响应模型可以克服上述缺陷
线性概率模型:
E(y=1|X)=P(y=1|X)=?0+ ?1x1+ ?2x2+…+ ?kxk
二值响应模型:
P(y=1|X)=P(y=1|x1,x2, …,xk)
=G(?0+ ?1x1+ ?2x2+…+ ?kxk)=G(?0+X?)
G是一个取值范围严格介于0和1之间的函数:对所有实数z,都有0G(z)1。
G函数的两种非线性形式
--在对数单位模型中,G是一个标准的逻辑斯蒂随机变量的累积分布函数
--在概率单位模型中,G是标准正态的累积分布函数
二值响应的对数单位和概率单位模型
二值响应的对数单位和概率单位模型
对数单位和概率单位模型均可由一个满足经典现行模型假定的潜变量模型推导出来:
y*=?0+X?+e, y=1[y*0]
1[.]定义一个二值结果,函数1[.]被称为指标函数,它在括号中的事件正确时取值1,在其他情况下取值0。
y*0 →y=1; y* ≤ 0 →y=0.
P(y=1|X)=P(y*0|X)=P[e-(?0+X?)|X)]
=1-G[-(?0+X?)]=G(?0+X?)
二值响应的对数单位和概率单位模型
E(y*|X)= ?0+X?; E(y|X)=P(y=1|X)=G(?0+X?)
X对成功概率的影响
二值响应的对数单位和概率单位模型
极大似然估计法
多重假设的检验
LM检验或得分检验
Wald统计量检验
LR统计量检验
解释对数单位和概率单位模型的估计值
拟合优度
--正确预测百分数
--伪R2
解释对数单位和概率单位模型的估计值
计算偏效应
Stata实现
logit y x1 x2 x3
probit y x1 x2 x3
mfx (计算在样本均值处的边际效应)
mfx, at (x1=0) (计算在“x1=0,x2,x3 取样本均值”处的边际效应)
mfx,eyex (计算在样本均值处的弹性)
predict yhat (计算发生概率的预测值)
estat clas (计算预测准确的百分比)
help margins
17.2 用于角点解响应的托宾模型
y在严格为正值时连续,但以正概率取值0.
线性概率模型:E(y|x1,x2, …)=?0+?1x1+…+?kxk
--可能得到负的拟合值;
--以水平值出现的自变量的偏效应为常数;
--y的分布堆积在0处,不具有条件正态分布,所有推断都只有渐进的合理性;
--估计结果有偏和不一致。
17.2 用于角点解响应的托宾模型
17.2 用于角点解响应的托宾模型
计算偏效应:
17.2 用于角点解响应的托宾模型
计算偏效应:
17.2 用于角点解响应的托宾模型
Stata实现
tobit depvar [indepvars] [if] [in] [weight] , ll[(#)] ul[(#)] [options]
xttobit depvar [indepvars] [if] [in] [weight] [, options]
例17.2 已婚妇女的年度劳动供给
例17.2 已婚妇女的年度劳动供给
托宾模型中的设定问题
17.3 泊松回归模型
非负因变量是计数变量,可以取非负整数值{0,1,2,…},如:生育子女个数、某人在某年被拘捕次数、一个企业在某年申请专利的个数等。
E(y|x1,x2, …,xk)=exp(?0+ ?0x1+…+ ?kxk)0
log[E(y|x1,x2, …,xk)]= ?0+ ?0x1+…+ ?kxk
对于连续变量:
%?E(y|x) ≈(100?0) ?xj
对于离散变量:
exp(?0+ xk-1?k-1+ ?kx1k)/exp(?0+ xk-1?k-1+ ?kx0k)-1
exp(?k ? xk)-1
17.3 泊松回归模型
17.3 泊松回归模型
在泊松分布中:Var(y|X)=E(y|X)
当在没有假定泊松分布完全正确的情况下使用泊松MLE,则为准极大似然估计(QMLE)
假定方差与均值成比例:
Var(y|X)=?2E(y|X)
通常的泊
原创力文档

文档评论(0)