- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[工学]8第八章包含虚拟变量的回归
第七章 包含虚拟变量的回归 目录 第一节 虚拟变量含义 第二节 虚拟变量设定 第三节 虚拟变量技术的特殊应用 作业 第一节 虚拟变量含义 P212 一、虚拟变量含义 二、方差分析模型 三、协方差模型(ANCOVA) 四、小结 返回 一、虚拟变量(dummy variable) 对某个定性因素人为赋值,成为能进入模型的变量。 例:解释薪酬差异,设以教育年限X1、工作经验(工作年数)X2 ,“性别”三个变量来解释 :对于性别,设置虚拟虚拟变量D: =0,男性 =1女性 Y=b0+b1 X1 +b 2X2+b3 D 当b3 能够通过t检验时,说明性别对薪酬有影响,即存在性别歧视 P213,例10-1:男女平均食品开支 Y^=3176.8-503.16D,其中虚拟变量D =0,男性 =1,女性 D=0,即取值为0的那一类称为基准类/基础类/参照类/比较类 返回 方差分析模型在其他社会科学中使用较多 二、方差分析模型(ANOVA):特别的,当回归中解释变量都是虚拟变量时,此类模型称为方差分析模型。P212 Y=b0+b1 D1 +b 2D2+…… 返回 三、协方差模型(ANCOVA) 解释变量有定性变量也有定量变量.(P217) Y=b0+b1 X1 +b 2X2+b3 D 返回 四、小结 虚拟变量是一用以反映质的属性的一个人工变量,通常记为D。 虚拟变量D只取0或1两个值 设D=0,即取值为0的那一类称为基准类/基础类/参照类/比较类 虚拟变量引入模型,可以直接使用OLS,不会带来新的估计问题。返回 第二节 虚拟变量设定 一、虚拟变量设置原则 二、虚拟变量进入模型方式(补充) 返回 一、虚拟变量设置原则 1、模型中只有一个两分定性变量 2、模型中一个定性变量,该变量具有多种分类 3、小结 4、模型中有多个定性变量 返回 1、模型中只有一个两分定性变量p217 例如性别定性变量,只有两种分类,引入一个虚拟变量即可,设置虚拟变量D: =0,男性 =1,女性 不可引入两个虚拟变量,否则引起多重共线性 例题 P217 ,原例10-1,引入税后收入变量X Y^=1506.244-228.98D+0.06X,各系数均通过t检验 得: 女性的食品开支方程 Y^=1506.244-228.98+0.06X 男性的食品开支方程 Y^=1506.244+0.06X 两条样本回归线平行 返回 2、模型中一个定性变量,该变量具有多种分类,p218 即多分定性变量 假定根据横截面数据,我们做个人旅游支出Y对其收入X和学历的回归,学历这个定性变量,可分为: 中学以下、中学、大学三个层次, 如何设置虚拟变量? 我们有如下选择 引入一个虚拟变量D D= 2,大学;=1,中学;=0,中学以下 回归方程为:Y=b0+b1 X1 +b2 D 引入三个虚拟变量 D1=1,大学;=0,其他 D2=1,中学;=0,其他 D3=1,中学以下;=0,其他 回归方程为: Y=b0+b1 X1 +c1D1 +c2 D2+ c3 D3 引入二个虚拟变量 D1=1,大学;=0,其他 D2=1,中学;=0,其他 Y=b0+b1 X1 +c1D1 +c2 D2 返回 3、小结 一个定性变量如果有m中类型,则应当引入m-1个虚拟变量。 一个2分定性变量只需引入一个虚拟变量 一个有3种类型的定性变量需要引入二个虚拟变量 因为:一个虚拟变量有二个取值, 本身可以代表二个类型 返回 4、模型中有多个定性变量 p221 例:性别、种族和教育年限一起解释薪酬 这里有两个两分定性变量,肤色和种族 可引入两个虚拟变量 例-性别、肤色和工龄、学历(3种类型)一起解释薪酬 性别、肤色分别引入2个虚拟变量,学历引入2个虚拟变量 例题 P221 10-18:性别、种族对收入的影响 Y-小时工资,X-教育年限 D2-=1(女性);=0(男性) D3-=1(非白种人且非西班牙裔);=0(其他) Y^=-0.26-2.36 D2-1.73 D3+0.80X 总结:每个定性变量所需引入的虚拟变量比该变量类型数少一。 返回 二、虚拟变量进入模型方式 1、“加法”方式-改变截距 2、“ 乘法”方式-改变斜率 3、加法方式、乘法方式混合进入模型 4、交互影响(交叉项) 返回 1、“加法”方式 :Y=b0+b1 X1 +b2 D 加法方式意味着引入的虚拟变量或者说定性因素,仅对截距产生影响,对斜率没有影响 P217,10-8,加法方式引入性别虚拟变量意味着隐含一个假定: 男女的性别差异对边际消费倾向没有影响,为b1 。 即对斜率没有影响,仅对截距产生影响 返回 2、“ 乘法”方式 虚拟变量也会对斜率发生影响 Y=b0+(b1 +b2 D) X1
文档评论(0)