计量经济学讲义第七讲.docxVIP

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1

浙江工商大学金融学院姚耀军讲义系列

第七讲虚拟变量

一、含有虚拟变量的模型

假设居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女(6~21岁),教育费用支出就多。现在考虑模型:

yi=β0+β1xi+α0Di+εi(1)

其中,y表示教育支出,x表示收入,而D的取值是

有适龄子女无适龄子女

在这里,D就是一个虚拟变量,也被称为哑变量,它反映了定性因素的变化。模型(1)的等价形式由如下两个子模型组成:

无适龄子女家庭其教育费用支出函数(Di=0):

yi=β0+β1xi+εi

有适龄子女家庭其教育费用支出函数(Di=1):

yi=(β0+α0)+β1xi+εi

如果保持家庭收入一样,有适龄子女的家庭教育费用将比无适龄子女的家庭费用高α0。因此,虚拟变量D的显著性意味着子女的年龄结构对家庭教育费用有显著影响。

定性因素也可能影响斜率参数,例如随着收入水平的提高,家庭教育支出的边际消费倾向也可能会发生变化。为了反映定性因素对斜率参数的影响,可以设定模型:

yi=β0+β1xi+α1(xigDi)+εi(2)

模型(2)的等价形式由如下两个子模型组成:

无适龄子女家庭其教育费用支出函数(Di=0):

yi=β0+β1xi+εi

有适龄子女家庭其教育费用支出函数(Di=1):

yi=β0+(β1+a1)xi+εi

事实上,我们还可以设定更一般的模型,以涵盖定性因素不仅影响截距也影响斜率参数的情况:

yi=β0+a0Di+β1xi+α1(xigDi)+εi

当然,我们可以利用t检验或者F检验分别判断0、1单个或者联合显著性,进而确定

哪一种模型设定合理。

2

浙江工商大学金融学院姚耀军讲义系列

二、虚拟变量的设置原则

假设公司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素的影响,我们设置两个虚拟变量:

l0D1={〔1

l0

本科其他

研究生其他

如果把模型设定为:

yi=β0+β1xi+α0D1i+α1D2i+εi

其中y是年薪,x是工龄。模型等价于:

yi=β0+β1xi+εi大专以下(D1=D2=0)

yi=(β0+α0)+β1xi+εi本科(D1=1,D2=0)yi=(β0+α1)+β1xi+εi研究生(D1=0,D2=1)

下图是关于上述各个子模型的总体回归函数的图形表示:

年薪研究生

年薪

本科a1-a0

本科

大专以下

a0

β0

——工龄

在上例中,样本按学历分为三类。在考察学历对年薪的影响时,我们以具有大专以下学历的人为参考组。

练习:针对上例,如果以具有本科学历的人为参考组,并且假定工龄对年薪的边际影响不受学历影响,试建立模型。

针对上例,现在我们来回答四个问题,以加深对含虚拟变量模型的理解。

问题一:为何不直观地设定虚拟变量

〔2

l0D={1

l0

研究生

本科生

大专以下

浙江工商大学金融学院姚耀军讲义系列

并且模型为:yi=β0+β1xi+α0Di+εi?

回答:当采取上述模型设定时,各子模型总体回归函数如下图所示:

年薪

研究生

研究生本科

大专以下

a

a0

a0

——工龄

该图表明,当采取如此模型设定时一个假定被隐含:研究生与本科生之间、本科生与大专生之间的年薪差异程度是相同的,在数值上都等于a0。显然,这是非常强的假定。

问题二:为何不设置三个虚拟变量?

大专以下其他

并设定模型为:

yi=β0+β1xi+α0D1i+α1D2i+α2D3i+εi

回答:如果采取这样的设定,那么对于每一个职员,必有:

D+D+D=11i2i3i

应该注意,截距项还对应一个解释变量,取值恒为1。因此,模型存在完全共线性。此即虚拟变量设置陷阱。

笔记:

在实践中,虚拟变量设置陷阱往往不会成为真正的陷阱。这是因为,当模型存在完全共线性时,计量软件会提示你,它无法进行估计!

问题三:可不可以设定三个虚拟变量呢

回答:可以。设定模型为:

yi=β1xi+α0D1i+α1D2i+α2D3i+εi

应该注意到,该模型没有截距!当采取上述模型设定时,各子模型总体回归函数如下图所示:

年薪

研究生

本科

3a

文档评论(0)

下载吧,学习吧 + 关注
实名认证
文档贡献者

人人都可以学习,都可以进步

1亿VIP精品文档

相关文档