- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1
浙江工商大学金融学院姚耀军讲义系列
第七讲虚拟变量
一、含有虚拟变量的模型
假设居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女(6~21岁),教育费用支出就多。现在考虑模型:
yi=β0+β1xi+α0Di+εi(1)
其中,y表示教育支出,x表示收入,而D的取值是
有适龄子女无适龄子女
在这里,D就是一个虚拟变量,也被称为哑变量,它反映了定性因素的变化。模型(1)的等价形式由如下两个子模型组成:
无适龄子女家庭其教育费用支出函数(Di=0):
yi=β0+β1xi+εi
有适龄子女家庭其教育费用支出函数(Di=1):
yi=(β0+α0)+β1xi+εi
如果保持家庭收入一样,有适龄子女的家庭教育费用将比无适龄子女的家庭费用高α0。因此,虚拟变量D的显著性意味着子女的年龄结构对家庭教育费用有显著影响。
定性因素也可能影响斜率参数,例如随着收入水平的提高,家庭教育支出的边际消费倾向也可能会发生变化。为了反映定性因素对斜率参数的影响,可以设定模型:
yi=β0+β1xi+α1(xigDi)+εi(2)
模型(2)的等价形式由如下两个子模型组成:
无适龄子女家庭其教育费用支出函数(Di=0):
yi=β0+β1xi+εi
有适龄子女家庭其教育费用支出函数(Di=1):
yi=β0+(β1+a1)xi+εi
事实上,我们还可以设定更一般的模型,以涵盖定性因素不仅影响截距也影响斜率参数的情况:
yi=β0+a0Di+β1xi+α1(xigDi)+εi
当然,我们可以利用t检验或者F检验分别判断0、1单个或者联合显著性,进而确定
哪一种模型设定合理。
2
浙江工商大学金融学院姚耀军讲义系列
二、虚拟变量的设置原则
假设公司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素的影响,我们设置两个虚拟变量:
l0D1={〔1
l0
本科其他
〔
研究生其他
如果把模型设定为:
yi=β0+β1xi+α0D1i+α1D2i+εi
其中y是年薪,x是工龄。模型等价于:
yi=β0+β1xi+εi大专以下(D1=D2=0)
yi=(β0+α0)+β1xi+εi本科(D1=1,D2=0)yi=(β0+α1)+β1xi+εi研究生(D1=0,D2=1)
下图是关于上述各个子模型的总体回归函数的图形表示:
年薪研究生
年薪
本科a1-a0
本科
大专以下
a0
β0
——工龄
在上例中,样本按学历分为三类。在考察学历对年薪的影响时,我们以具有大专以下学历的人为参考组。
练习:针对上例,如果以具有本科学历的人为参考组,并且假定工龄对年薪的边际影响不受学历影响,试建立模型。
针对上例,现在我们来回答四个问题,以加深对含虚拟变量模型的理解。
问题一:为何不直观地设定虚拟变量
〔2
l0D={1
l0
研究生
本科生
大专以下
浙江工商大学金融学院姚耀军讲义系列
并且模型为:yi=β0+β1xi+α0Di+εi?
回答:当采取上述模型设定时,各子模型总体回归函数如下图所示:
年薪
研究生
研究生本科
大专以下
a
a0
a0
——工龄
该图表明,当采取如此模型设定时一个假定被隐含:研究生与本科生之间、本科生与大专生之间的年薪差异程度是相同的,在数值上都等于a0。显然,这是非常强的假定。
问题二:为何不设置三个虚拟变量?
生
大专以下其他
并设定模型为:
yi=β0+β1xi+α0D1i+α1D2i+α2D3i+εi
回答:如果采取这样的设定,那么对于每一个职员,必有:
D+D+D=11i2i3i
应该注意,截距项还对应一个解释变量,取值恒为1。因此,模型存在完全共线性。此即虚拟变量设置陷阱。
笔记:
在实践中,虚拟变量设置陷阱往往不会成为真正的陷阱。这是因为,当模型存在完全共线性时,计量软件会提示你,它无法进行估计!
问题三:可不可以设定三个虚拟变量呢
回答:可以。设定模型为:
yi=β1xi+α0D1i+α1D2i+α2D3i+εi
应该注意到,该模型没有截距!当采取上述模型设定时,各子模型总体回归函数如下图所示:
年薪
研究生
本科
3a
文档评论(0)