- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二节 离散因变量模型应用 前面介绍的回归模型中,被解释变量是连续的,但是在实际应用中,也存在被解释变量是定性选择结果的情况,例如,大学生毕业后选择就业或读研继续深造,在取得成年人的数据中,一部分人吸烟,一部分人不吸烟。进一步想要找出决定大学生就业与否、成年人吸烟与否的因素。这类模型常称为定性响应回归模型。这类模型表现为多种形式,这一节仅考虑最简单的一种,即 二元/二值/虚拟离散型因变量回归模型。 在离散型因变量分析中有多种模型,最常用的是Logistic 模型和 Probit 模型。本节中主要介绍这两种模型及其应用。 在二元选择模型中模型的因变量或被解释变量只有两种选择的定性结果,例如 :一事件发生与否。对此,首先引入虚拟变量把定性选择结果转化为数学变量,例如 哪种情况发生并不是确定的,因此这些虚拟变量是随机的。 考虑影响定性结果的因素,如 年龄、受教育程度、家庭收入和香烟的价格来推断吸烟行为,建立下列模型 这时被解释变量和解释变量做简单的线性回归是不正确的,因为一方面模型的误差项有一些假设条件不能满足,另一方面,上面 的拟合值也不可能限定在0和1之间。 为解决这一问题,可采用如下定义:假设一个与解释变量 有关的指标 使得 将这个指标表达为 有的教材中称 为Z值。 引入这个指标后,如果已知误差项 的概率分布函数 就可求得定性选择的概率 假设 的密度函数是偶函数(如 ),则 进而得 和 即 的分布列为 则 说明:如果解释变量 是随机变量,则 0 1 一、Logistic模型 Logistic模型(即逻辑模型是由Verhulst在1945年提出),是假定 服从Logistic分布,即它的分布函数形式是 通过求导数可知其密度函数是偶函数,因为 在上面的例子中,由于 所以 (4.1) 注意,对于逻辑模型 (4.2) 式中, 称为机会差异比,即所研究事件“发生”与“不发生”的概率之比。 总结: (4.2)式表明机会差异比的对数不仅对自变量为线性,而且对参数也是线性的。 称为logit(机会差异比的对数),因此常称这样的模型为logit模型。 附注: (1)尽管logit模型是线性的,但是用普通最小二乘法来估计是行不通的,原因是: 若某人吸烟, 若某人 不吸烟, 但如果将这些值直接带入 就会导致 的对数无意义. 因此要估计logit模型,必须求助其它估计方法。一般采用极大似然(ML)法或分组数据估计,也可用Eviews软件或SAS软件,在方程描述窗口直接选择Logit选项估计模型。 (2)若 是正的,就意味着当解释变量的值增加时,吸烟的机会将增大,若 为负,随着解释变量的值减小,吸烟的机会也减小。 (3)一旦估计出logit模型的系数,利用(4.1)式,容易计算出吸烟的概率 (4)对于取值仅为1或0的因变量,拟合优度统计量 没有多大意义,文献中常用的一个类似与 的统计量,叫做麦克法登(McFadden) 记作 它的取值也在0和1之间 (5) 模型的似然比(LR)统计量(与线性回归模型中的F检验是等价的),是用来检验模型中全部系数同时为零的原假设。LR检验统计量服从自由度为解释变量个数的 分布 例3.3.1 从网上获得1979年美国1196名男子的数据,在分析过程中用到下列变量: Age=年龄,Educ=受教育年限,Income=家庭收入, Pcigs=1979年美国各州的香烟价格。 使用极大似然估计法,通过Eviews,分析吸烟与否同年龄、受教育年限、家庭收入和1979年美国各州的香烟价格之间的关系,记 基于Logistic模型得到下列结果 括号中的值是对应的p值 (1)根据p值知,年龄和受教育年限这两个变
原创力文档


文档评论(0)