6虚拟变量.pptVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6虚拟变量

虚拟变量 * 虚拟变量的性质 因变量受到一些定性变量的影响 如:性别、种族、季节、不同历史时期等 这类定性变量称为虚拟变量(dummy variables) 用D表示虚拟变量 虚拟变量的取值通常为0和1? ?虚拟变量—定性变量或分类变量 回归模型可以只包含虚拟变量。 仅仅包含定性变量或虚拟变量的回归模型称为方差分析模型(analysis-of-variance models,ANOVA) * 令Y=年薪,建立如下模型: 男性就业者的平均年薪: 女性就业者的平均年薪: 如果B2 =0 ? 说明不存在性别歧视 例1: 建立模型研究女性在工作中是否受到歧视 定义一个虚拟变量: 如果B2 <0 ? 说明存在性别歧视 B2称为差别截距系数,它表示了两类截距值的差异。 通常我们把取值为0的一类称为基准类、基础类、参照类或比较类。 如果模型有共同的截距项,且定性变量有m种分类,则需引入m-1个虚拟变量。 如果不符合这条原则,则会陷入虚变量陷阱! * * 包含一个定量变量、一个定性变量的回归模型 (一)只影响截距(加法模型) 例2,再引入一个变量 X=工作年限 建立如下模型: 如果B3 =0? 说明不存在性别歧视 男性就业者的平均年薪: 女性就业者的平均年薪: 如果B3 <0 ? 说明存在性别歧视。 在社会学、心理学、教育学及市场研究等领域,ANOVA模型应用的非常广泛,但经济学中一般很少涉及。 在经济学研究中,回归模型一般既包括定量解释变量,又包括定性解释变量。 我们把这种回归模型称为协方差分析模型(analysis-of-covariance models, ANCOVA) * * 虚拟变量只影响截距不影响斜率——加法模型 * 如果随着工龄增加,男性与女性的年薪差距发生变化,则模型设为 (二)只影响斜率(乘法模型) 图2描绘了男性年薪增加较快的情况。 * 婚姻状况与性别对工资的影响 married:已婚取1 famle:女性取1 交互作用表示两个变量对因变量的联合影响。 可以表现为虚拟变量与虚拟变量间的交互,也可以表现为虚拟变量同定量变量间的交互。 定量变量与虚拟变量的交互形式前的系数称为差别斜率系数(也称为斜率漂移) * * (三)同时影响截距与斜率(混合模型) 加法模型和乘法模型的结合: 用来表示截距和斜率都发生变化的模型,称为混合模型。 例P76 * * 有多种分类情况下虚拟变量的应用 例2、研究本科生、硕士研究生和博士研究生的初职月薪有何差异。 按照学历标准,有三类人员 需引入两个虚拟变量 Y=初职月薪 表1:本科生、研究生和MBA毕业生的初职月薪 单位:人民币元 数据见表1 Y=初职月薪 * OLS回归结果如下: t= (4.45) (4.52)(15.59) 截距项: 本科生的平均初职月薪,研究问题的基准类; D1的系数: 硕士生与本科生平均初职月薪的差额; D2的系数: 博士生与本科生平均初职月薪的差额。 * 虚拟变量陷阱: 引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱。 * 包含一个定量变量、两个定性变量的回归模型 研究的问题中需要按不同标准引入多个定性变量 例:研究大学教师的年薪是否受到性别、学历的影响。 按性别标准教师分:男、女两类 引入一个虚拟变量; 按学历标准大学教师分:大学本科、研究生、博士三类 引入两个虚拟变量 总计需要引入三个虚拟变量: 令Y=年薪, X=教龄,建立模型如下: * 虚拟变量在季节分析中的应用 每个季节的消费不同 事实真的如此?如何验证? 虚拟变量的引入与定义: 一年四季,引入三个虚拟变量 建立模型 * 回归模型中的结构稳定性检验 建立模型来拟合经济发展出现转折的情况 * 回归模型中的结构稳定性检验 建立模型来拟合经济发展出现转折的情况 回归方程为 * * 图1表明男女就业者的平均年薪对工龄的函数具有相同斜率β1 ,即随着工龄的增长男女工资的增长幅度相同;截距不同,说明男女的初始年薪不同。 * 所有回归数的符号与预期的一致。 模型表明: 研究生的初职月薪比本科生高143.5%。MBA毕业生的初值月薪比本科生高494.8%;MBA毕业生的初职月薪比研究生高144.2%。从这三个层次毕业生的初职月薪可以看出他们的竞争能力。模型的示意图如下。 * 未讲 * 未讲 * * 图1表明男女就业者的平均年薪对工龄的函数具有相同斜率β1 ,即随着工龄的增长男女工资的增长幅度相同;截距不同,说明男女的初始年薪不同。 * 所有回归数的符号与预期的一致。 模型表明: 研究生的初职月薪比本科生高143.5%。MBA毕业生的初值月薪比本科生高494.8%;MBA毕业生的初职月薪比研究生高144.2%

文档评论(0)

lifupingb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档