- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对外经济贸易大学
计量经济学
I n t r o d u c t i o n t o E c o n o m e t r i c s
导论
多个组别虚拟变量,
虚拟变量陷阱以及阈值效应
多个组别的虚拟变量
我们可以使用一组虚拟变量来表示多个组
别的定性信息。
例如,我们有三种教育水平的个体,高中辍学,
高中毕业,大学毕业,我们可以定义两个虚拟
变量
hsgradi = 1 如果个体i最高教育水平为高中毕业
0 其他
colgrad = 1 如果个体i最高教育水平为大学毕业
i 0 其他
多个组别的虚拟变量
思考: 01 (1,0),(0,1),(0,0) 分别代表什么?
02 谁是基准组?
多个组别的虚拟变量
一般地,如果我们有个组别,在一个带常
数项的回归中,我们需要定义− 1个虚拟变量。
如果我们包括个虚拟变量,则会造成虚
拟变量陷阱(dummy trap),即个虚拟变量之和
与常数项构成完全的多重共线性。
多个组别的虚拟变量
例:收入的地域差异
inc = + East + Mid + West
i 0 1 2 3
i=1, 上海, (1,0,0 )
i 2, 武汉, (0,1,0 )
i 3, 成都, (0,0,1 )
显然,由于每个城市属于且仅属于一个区
域,每个观测值有且只有一列取1,三列之和总
是等于1。
多个组别的虚拟变量
例:工资的性别差异与婚姻溢价
假设有四个组别的个体:未婚男性,
未婚女性,已婚男性,已婚女性
log( Wage) =0.321 +.213marrmale –
(0.100) (0.055)
0.198marrfem-0.11singfem + .079educ
(0.058) (.056) (.007)
+.027exper -.00054exper 2
(.005) (.0001)
+.029tenure -.00053tenure2
(.007) (.00023)
多个组别的虚拟变量
log( Wage) =0.321 +.213marrmale –
(0.100) (0.055)
0.198marrfem-0.11singfem + .079educ
(0.058) (.056) (.007)
+.027exper -.00054exper 2
(.005) (.0001)
+.029tenure -.00053tenure2
(.007
文档评论(0)