- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高级计量经济学删改或截取回归模型
第七章删改或截取回归模型
(Censored or truncated models)
1
本章内容
删改数据或截取数据
模型估计中的问题
受限因变量模型(TOBIT模型)
模型估计方法与统计检验
案例分析
2
截取数据
当样本是总体中的某个特殊子集时,我们遇到数据被截取的情况。
例1:针对贫困户的调查资料
例2:对有借款行为农户的调查
此时只观察到该特殊子集的各项资料,没有获得有关其他对象的观察资料。
此时出现样本对总体的代表性问题。
需要注意的是,总体的确定具有相对性,例如我们将贫困人口作为总体时,例1的情况不再属于截取。
3
删改数据
若样本在总体中的分布具有代表性,但当数据由于报告制度而使某些信息被高度简化时,我们遇到“删改数据”情况 。
如果Y*处于某个范围,那么Y=Y*;如果Y*处于其他范围,那么Y=某个固定值。
例:农户收入的调查中将低于某一水平的农户全部报告为贫困户而没有报告具体的收入数据。
删改数据仍有关于总体的自变量信息,但关于因变量的信息不完整。
删改数据情况可以被看作是由于数据报告制度存在缺点,造成信息含量的损失。
4
截取数据和删改数据的概率分布
5
容量限制
座位
贫困线
收入
截取:所选择的样本是总体的一个子集。
删改:样本来自总体,但观察结果不完整,或报告的信息简化。
例1:居民收入
例2:对电影票的需求
截取数据和删改数据
从统计技术角度讲,由于两种情况均导致随机变量的分布形式发生变化,并引起丢失解释变量错误,因而利用OLS方法估计模型会出现估计系数偏差。
在很多应用工作中,人们常常利用受限因变量模型处理存在上限、下限或上下限的数据,而不去认真考虑究竟数据体现何种性质。
6
截取随机变量的密度分布
定理:截取随机变量的密度分布(考虑存在下限约束的情况)
如果连续随机变量x的概率密度函数为f(x),且该变量面临一个限制a,那么截取后x的概率密度函数为:
7
隐变量(Latent Variables)
对于截取数据模型或删改数据模型,均可以借鉴二元因变量模型引入的隐变量概念;
模型中的隐变量是解释变量的函数(假定存在下限0)
y* = β0 +βx + e
然而我们只能观察到y= max(0, y*)
即:
当y* 0时y = y*
当y* ≤0时y =0
8
截取数据模型
假定回归模型的确定性部分为:
而包括正态分布随机误差的方程为(假定e服从标准正态分布,方差为2):
因而y为服从以下分布的随机变量:
9
截取数据模型
截取对随机变量分布的影响体现在:
当截取发生在低端时,分布的均值增大;反之,截取发生在高端时,分布的均值减少。
截取降低了分布的方差。
10
截取正态分布变量的矩
定理:如果x~N(,2),c是一个常数,那么有:
截取均值 E[x| truncation]= +()
截取方差 Var[x| truncation]= 2[1-()]
式中:
=(c-)/
如果xc, 那么()=()/[1-()]
如果xc, 那么()=-()/()
()=()[()-],对于所有的有0()1
函数()被称作inverse Mills ratio。
11
截取数据模型
当y在点c处被截取时,根据前述的定理,y的条件均值为:
用OLS方法估计此类模型时,我们不仅遇到异方差现象,而且出现丢失解释变量,从而使估计结果出现偏差,统计检验失效。
在对误差的分布形式做出假定后,该模型可以利用最大似然法估计得出。
12
删改数据模型
删改数据通常指的是当数据落在某一范围时所有数据均被转变为单一数值或以单一数值形式报告的情况。
在应用经济学研究中,很多情况可以被看作是删改数据:
家庭耐用品购买
就业时间
新技术采用率
商品消费
农民转业(所有农民都有转业的意愿,但只有那些已经实现转业的人才显示出来。)
13
删改数据模型
对于删改数据,其因变量的概率分布是一个离散分布和连续分布的混合。
OLS方法无法区分达到极限的观察值和未达到极限的观察值(连续变量),因而估计结果存在偏差。
删改数据模型也可以基于不同的误差项概率分布假定。
在应用工作中,删改点可以发生在任何数值上,可以是固定的,也可以由某个连续变量所确定。
14
删改数据模型
为了分析上述情况,定义随机变量y为:
如果y*0,那么y=0
如果y*0,那么y=y*
假定y*为正态分布变量(y*~N(,2),此时有:
Pr(y=0)=Pr(y*0)= (-)=1- ()
Pr(y0)=Pr(y*)
15
Tobit模型
上述两种情况均可以表示为Tobit模型,其一般形式为:
Tobit模型需要利用最大似然法来估计参数β和σ;
需要注意的是,β反映的是X对
原创力文档


文档评论(0)