第四部分 其他 离散因变量和受限因变量模型.pptVIP

  • 75
  • 0
  • 约5.9千字
  • 约 56页
  • 2017-11-28 发布于湖北
  • 举报

第四部分 其他 离散因变量和受限因变量模型.ppt

第四部分 其他 离散因变量和受限因变量模型

* Ordered logit估计 use panel184extract.dta,clear ologit rating83c ia83 dia,nolog 预测每个公司的评级概率 predict r2 r3 r4 r5(预测评级概率,并命名) list r2 r3 r4 r5 in 1/1(仅显示第一个公司评级概率) * * Ordered probit估计 use panel184extract.dta,clear oprobit rating83c ia83 dia,nolog 预测每个公司的评级概率 predict p2 p3 p4 p5 list p2 p3 p4 p5 in 1/1 * * 第二节 受限因变量模型 在某些情况下,被解释变量的取值范围可能受到限制,称为受限因变量模型(limited dependent variable models)。 本节研究两类受限因变量模型 审查回归,截取回归,归并问题(censored) 截断回归,断尾回归(truncated)。 * “归并” (censoring)问题 将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。 例如: 需求函数模型中用实际消费量作为需求量的观测值,如果存在供给限制,就出现“归并”问题。 被解释变量观测值存在最高和最低的限制。例如考试成绩,最高100,最低0,出现“归并”问题。 * “截断”(truncation)问题 由于条件限制,样本不能随机抽取,即不能从全部个体,而只能从一部分个体中随机抽取被解释变量的样本观测值,而这部分个体的观测值都大于或者小于某个确定值。 “掐头”或者“去尾”。 例如: 银行贷款,我们只能观察到获得银行贷款的企业的数据。(实际上是选择性样本)通常表现为“截断样本”。原因:问题的局限。 * 一、审查回归模型(censored regression models ) 定义1:对于线性回归模型 ,当 或者 时,所有y都被记录为c。 即:当被解释变量为截取数据时,我们虽然有全部观察数值,但对于某些观察数据,被解释变量被压缩再一个点上了。 此时Y的概率分布变成由一个离散点,与一个连续分布所组成的混合分布 * 一、审查回归模型(censored regression models ) 例如: 买车开支。如果买车,那么买车开支为正,不买车开支为0 企业RD支出。有相当部分企业的RD支出为0.有RD支出的企业数据大致连续分布 假设真实情况为 * * Tobit模型(一类特殊,代表性的截取回归模型) 一类重要的限制因变量模型,在严格为正时大致连续,但总体中有一个不可忽略的部分取值为零。 例如,某人在一个月中酒方面的花费就是一个例子。有相当多的人在酒方面的花费为零。我们不是简单的将这些观测从样本中去掉,而是建立Tobit模型。 * TOBIT模型的理论基础,考虑下面的潜在因变量回归模型 (1) 其中:? 是比例系数;y*是潜在变量。被观察的数据 y 与潜在变量 y* 的关系如下: (2) 数据的现实: 问题是可以得到全部观察值,但是信息可能不全面。 对估计的影响 如果用OLS,无论是用整个样本,还是去掉离散点后的子样本,都不能得到一致估计 * * 审查回归模型的极大似然估计 可以采用极大似然法估计审查回归模型的参数,对数似然函数为 (4) 求式(4)的最大值即可得参数? , ? 的估计。这里f , F分别是u的密度函数和分布函数。 * 二、 截断(断尾)回归模型 (truncated Regression) 定义: 对于线性模型, ,假设只有 的数据才能观测到。 形象地说:就是掐头或者去尾。即在很多实际问题中,不能从全部个体中抽取因变量的样本观测值,而只能从大于或小于某个数的范围内抽取样本的观测值 * 例如,在研究与收入有关的问题时,收入作为被解释变量。从理论上讲,收入应该是从零到正无穷,但实际中由于各种客观条件的限制,只能获得处在某个范围内的样本观测值。这就是一个截断问题。 数据存在的问题 数据缺失 估计方法 MLE 但是要利用条件密度函数 * 断尾前Y的概率密度函数为: 样本被观察到的概率 断尾后的条件密度为 * * * 求解该1阶极值条件,即可以得到模型的参数估计量。 由

文档评论(0)

1亿VIP精品文档

相关文档