6.虚拟变量.pptVIP

  • 8
  • 0
  • 约2.05千字
  • 约 21页
  • 2016-11-25 发布于河南
  • 举报
6.虚拟变量

虚拟变量 * 虚拟变量的性质 因变量受到一些定性变量的影响 如:性别、种族、季节、不同历史时期等 这类定性变量称为虚拟变量(dummy variables) 用D表示虚拟变量 虚拟变量的取值通常为0和1? ?虚拟变量—定性变量或分类变量 回归模型可以只包含虚拟变量。 仅仅包含定性变量或虚拟变量的回归模型称为方差分析模型(analysis-of-variance models,ANOVA) * 令Y=年薪,建立如下模型: 男性就业者的平均年薪: 女性就业者的平均年薪: 如果B2 =0 ? 说明不存在性别歧视 例1: 建立模型研究女性在工作中是否受到歧视 定义一个虚拟变量: 如果B2 <0 ? 说明存在性别歧视 B2称为差别截距系数,它表示了两类截距值的差异。 通常我们把取值为0的一类称为基准类、基础类、参照类或比较类。 如果模型有共同的截距项,且定性变量有m种分类,则需引入m-1个虚拟变量。 如果不符合这条原则,则会陷入虚变量陷阱! * * 包含一个定量变量、一个定性变量的回归模型 (一)只影响截距(加法模型) 例2,再引入一个变量 X=工作年限 建立如下模型: 如果B3 =0? 说明不存在性别歧视 男性就业者的平均年薪: 女性就业者的平均年薪: 如果B3 <0 ? 说明存在性别歧视。 在社会学、心理学、教育学及市场研究等领域,ANOVA模型应用的非常广泛

文档评论(0)

1亿VIP精品文档

相关文档