10.2 持续时间数据模型.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10.2 持续时间数据模型

§10.2 持续时间数据模型 Duration Data Model 一、计量经济学中持续时间分析问题的提出 二、Hazard比率与Hazard比率模型 一、计量经济学中持续时间分析问题的提出 ⒈ 经济生活中的持续时间问题 以某项活动的持续时间作为研究对象的经济问题。 失业问题 罢工问题 设备运行时间问题 ⒉ 持续时间被解释变量的计量经济学问题 以失业的持续时间分析为例,看看这类计量经济学问题的特征。 以失业的持续时间t 作为被解释变量,以年龄、受教育程度、家庭状况、工作经历、健康状况等作为解释变量,建立如下失业模型: 模型的3个特点: 失业已经持续的时间并不是失业持续时间的真实反映,不能作为失业持续时间的观测值。 取得部分解释变量的样本观测值存在困难,因为它们在持续时间内是变化的。 失业者关心的不是如何解释失业已经持续的时间,而是希望知道在观测值t时刻之后的最短时间内能够重新就业的可能性为多大。 首先从上述持续时间被解释变量计量经济学模型的第3个特征入手; 并假设解释变量的样本观测值在失业持续的时间内是不变化的,即忽略上述第2个问题; 然后再扩展到两类样本数据,即第1个问题。 二、Hazard比率与Hazard比率模型 ⒈ Hazard比率 随机变量T具有连续的概率密度函数f(t),t是T的一个观测值,即事件已经持续的时间。应该有: 称为Hazard比率。事件以该比率在已经持续t时间后结束。 ⒉ 不考虑外生变量的Hazard比率模型 既然人们更关心事件在t之后的一个短时间Δ内结束的可能性,而该可能性又可以通过Hazard比率来描述,那么可以直接建立Hazard比率模型,估计Hazard比率的参数,然后再通过积分得到生存函数和条件分布函数。这就是持续时间被解释变量计量经济学模型的总的研究思路。 如何构造和求解Hazard比率模型,首先通过两个简单的例子来说明。 ⑴ Hazard比率为一个常数 假设Hazard比率为一个常数λ,即假设事件在t之后的一个短时间内结束的概率是相同的,与已经持续的时间无关。这种事件在实际中也是存在的,被称为“无记忆”的过程。 那么即有: 这就是说t的生存函数S服从指数分布。 如何估计常数λ? 因为对于指数分布,有: ⑵Hazard比率为一个线性函数 由t的密度函数和样本观测值,利用最大似然法,可以得到参数α、β的估计量,进而得到Hazard比率的估计量,使该持续时间计量经济学问题得到解决。 ⒊ 几种常用的Hazard比率模型 在上面的描述中,首先对Hazard比率作出假设,导出生存函数和密度函数,然后利用最大似然法估计参数。 如果人们并不首先对Hazard比率作出假设,而是直接对生存函数所服从的分布作出假设,然后直接估计该分布的参数,结果是相同的。 这就是实际中通常采用的思路。其过程如下: 下列分布经常被作为生存函数S(t)的分布 ⒋考虑两类样本数据的最大似然估计 必须将持续时间样本观测值分为两类,一类是对已经结束的事件进行的调查,一类是对仍处于持续过程中的事件进行的调查。对于前者,持续时间的观测值是真实的;而对于后者,样本观测值实际上是“归并”数据。 Hazard比率模型的对数似然函数为: ⒌考虑外生变量的Hazard比率模型 对事件持续进行因果分析,则要引入影响持续时间的各种因素。 但是,人们并不建立以持续时间为被解释变量的模型,而是以Hazard比率为被解释变量,以影响持续时间的各种因素为解释变量建立模型,而且为了估计的方便,对模型的关系类型作出特定的假设。 例如,对于生存函数服从韦伯分布的情况,建立如下模型,并且假设在持续的时间内,Xi具有不变的观测值。 采用最大似然法估计等价的线性模型。 考虑到持续时间样本观测值分为两类,令 利用 * 定义为生存函数 事件在t之后的一个短时间Δ内结束的概率 Hazard比率与t的概率密度函数f、条件分布函数F和生存函数S之间的关系 微分方程的解 因为 ,得到K=1 即为λ的最大似然估计量。其中的f由样本观测值计算得到,于是得到Hazard比率的估计量。 如果得到参数β的估计量为正,表示Hazard比率随着持续时间的增长而增大,也表示在t之后的一个短时间Δ内结束事件的概率随着持续时间的增长而增大;如果得到参数的估计量为负,则反之。 韦伯分布 对数正态分布 对数逻辑分布 对于生存函数的每种分布,都有对应的Hazard比率函数。 等价的线性模型 *

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档