虚拟变量(哑变量)回归.pptVIP

  • 5
  • 0
  • 约1.76千字
  • 约 11页
  • 2022-03-11 发布于河北
  • 举报
——虚拟变量的应用 多元线性回归 Contents 一、虚拟变量的建立 虚拟变量(Dummy Variable):取值为0和1的变量,当案例属于一个虚拟 变量所代表的类别时,这个虚拟变量就赋值为1,否则变赋值为0 Di = 1 ,是女性 = 0 ,不是女性 例1: 例2:大学生年级变量具有四个类别,如何构造? 其中, D1=1,是大一,否则为0; D2=1,是大二,否则为0; D3=1,是大三,否则为0; D4=1,是大三,否则为0。 “虚拟变量陷阱” 虚拟变量的建立 D1+D2+D3+D4=1,说明D1,D2,D3,D4存在线性相关,造成多重共线性 解决办法: 原则:当一个分类量具有k个类别时,则仅引入k-1个虚拟变量。 当所有k-1个自变量都取0的时候,那这个案例就属于第k类,我们称这类为参照类,参照类不仅解决了共线性的问题,而且在分析回归结果时也有非常重要的意义 二、虚拟变量回归系数的意义 因变量为大学生的月支出,自变量有家庭月收入,年级,性别 建立回归方程: (0) 其中, DG2=1,是大二,否则为0; DG3=1,是大三,否则为0; DG4=1,是大三,否则为0。 DS=1,是女生,否则为0 虚拟变量回归系数的意义 (1) 参照类

文档评论(0)

1亿VIP精品文档

相关文档