第7讲包含虚拟变量的回归分析.pptVIP

  • 51
  • 0
  • 约1.18万字
  • 约 42页
  • 2020-09-10 发布于天津
  • 举报
交互项 例题 7_9 (课本 p230-233 ) o 检验两组回归方程是否完全相同的假设检验通常被称为 邹检 验( Chow test ), 同学们不用刻意去记它,只要知道它是一 种特殊的 F 检验就可以了 的 动 员 的 回 归 方 程 是 相 同 即 不 能 认 为 男 女 大 学 运 的 水 平 上 拒 绝 , 至 少 可 以 在 , , 1 32 . 3 ) 358 , 4 ( 18 . 8 ) 1 /( ) 1 ( / ) ( 4 7 366 3516 . 0 , 4059 . 0 0 01 . 0 2 2 2 2 2 H % F k n R q R R F ,q ,k n R R ur r ur r ur ? ? ? ? ? ? ? ? ? ? ? ? 第七讲 包含虚拟变量的回归分析 Regression Analysis with Dummy Variables 一、什么是虚拟变量? 二、自变量中包含虚拟变量 三、因变量为虚拟变量 一、什么是虚拟变量? 什么是虚拟变量? 变量的分类 a. 定类 / 类别变量( nominal/categorical variable ) b. 定序 / 有序变量( ordinal variable ) c. 定距 / 定量变量( interval variable ) o 问题:如何在计量分析中使用定类变量和定序变量 什么是虚拟变量? o 对于只有两种取值的定类变量,可以用 0 和 1 表示这两种取值 。这样的变量称为 虚拟变量( dummy variable ) 或 二分变量 ( binary variable ) 。其中,赋值为 0 的一组称为 对照组( reference group ) 或 基准组( benchmark group ) o 注意:变量名的选择 ? ? ? ? ? ? ? ? ? ? ? ? 非亚洲国家 亚洲国家 ; 非党员 中共党员 ; 男性 女性 , , Asia , , CCP , , female 0 1 0 1 0 1 什么是虚拟变量? o 对于有多个取值的定类变量,可构造多个虚拟变量来表示 o 用 east 、 central 、 west 三个虚拟变量表示不同地区 o 用 sx 、 jy 、 qt 三个虚拟变量表示本科生毕业后的状态 ? ? ? ? ? ? ? ? ? ? ? ? 东部或中部 西部 ; 东部或西部 中部 ; 中部或西部 东部 , 0 , 1 , 0 , 1 , 0 , 1 west central east ? ? ? ? ? ? ? ? ? ? ? ? 升学或就业 其他情况 ; 未就业 就业 ; 未升学 升学 , 0 , 1 , 0 , 1 , 0 , 1 qt jy sx 什么是虚拟变量? o 对于定序变量和定距变量,也可以用虚拟变量表示 o 学习成绩(定序变量) o 年收入(定距变量,但通过划分收入区间将之转换为虚拟变量) ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 其他 不及格 ; 其他 及格 ; 其他 良好 ; 其他 优秀 , 0 , 1 4 , 0 , 1 3 , 0 , 1 2 , 0 , 1 1 g g g g ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 其他 万元以上 ; 其他 万元 ; 其他 万元 ; 其他 万元以下 , 0 10 , 1 4 , 0 10 5 , 1 3 , 0 5 1 , 1 2 , 0 1 , 1 1 i i i i 1. 自变量中包含一个虚拟变量 2. 自变量中包含多个虚拟变量 3. 交互项 二、自变量中包含虚拟变量 自变量中包含一个虚拟变量 自变量仅为一个虚拟变量 o 如果自变量仅为一个虚拟变量,实际上是以自变量为分类依 据,分析因变量的均值差异 类 的 均 值 存 在 显 著 差 异 是 统 计 显 著 的 , 说 明 两 若 的 均 值 为 : 时 , 当 虚 拟 变 量 的 均 值 为 : 时 , 当 虚 拟 变 量 对 于 D D Y E Y D D Y E Y D u D Y 1 0 0 1 0 ) 1 | ( 1 ) 0 | ( 0 , ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 自变量中包含一个虚拟变量 例题 7_1 :工资差异 美 元 为 已 婚 劳 动 者 的 平 均 工 资 美 元 为 未 婚 劳 动 者 的 平 均 工 资 美 元 女 性 的 平 均 工 资 为 美 元 男 性

文档评论(0)

1亿VIP精品文档

相关文档