第7讲包含虚拟变量的回归分析.pptVIP

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7讲包含虚拟变量的回归分析

第七讲 包含虚拟变量的回归分析 Regression Analysis with Dummy Variables 一、什么是虚拟变量? 二、自变量中包含虚拟变量 三、因变量为虚拟变量 什么是虚拟变量? 变量的分类 定类/类别变量(nominal/categorical variable) 定序/有序变量(ordinal variable) 定距/定量变量(interval variable) 问题:如何在计量分析中使用定类变量和定序变量 什么是虚拟变量? 对于只有两种取值的定类变量,可以用0和1表示这两种取值。这样的变量称为虚拟变量(dummy variable)或二分变量(binary variable)。其中,赋值为0的一组称为对照组(reference group)或基准组(benchmark group) 注意:变量名的选择 什么是虚拟变量? 对于有多个取值的定类变量,可构造多个虚拟变量来表示 用east、central、west三个虚拟变量表示不同地区 用sx、jy、qt三个虚拟变量表示本科生毕业后的状态 什么是虚拟变量? 对于定序变量和定距变量,也可以用虚拟变量表示 学习成绩(定序变量) 年收入(定距变量,但通过划分收入区间将之转换为虚拟变量) 自变量中包含一个虚拟变量 自变量仅为一个虚拟变量 如果自变量仅为一个虚拟变量,实际上是以自变量为分类依据,分析因变量的均值差异 自变量中包含一个虚拟变量 例题7_1:工资差异 自变量中包含一个虚拟变量 自变量包含定距变量和一个虚拟变量 此时,虚拟变量的回归系数表示在控制其它自变量的情况下,两组之间的差异 例题7_2:课本p217,例7.2 自变量中包含一个虚拟变量 自变量包含定距变量和一个虚拟变量 虚拟变量可用于政策分析,虚拟变量取值为0的一组称为控制组或对照组(control group),取值为1的一组称为实验组(experimental group)或处理组(treatment group) 例题7_3:课本p218,例7.3 自变量中包含多个虚拟变量 自变量中包含多个虚拟变量可分为三种情况 每个虚拟变量代表不同的分类 若干个虚拟变量代表同一种分类,且这种分类是定类的 若干个虚拟变量代表同一种分类,且这种分类是定序的 自变量中包含多个虚拟变量 每个虚拟变量代表不同的分类 例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6) 引入性别和婚姻状况两个虚拟变量 上述结果表明,性别对工资有显著影响,但婚姻状况没有显著影响。这一模型可能存在问题,即假定婚姻状况的影响对于男性和女性是相同的。进一步的分析应考虑婚姻状况的影响存在性别差异。 自变量中包含多个虚拟变量 每个虚拟变量代表不同的分类 例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6) 虚拟变量的定义 如果有n种分类,则回归时只能引入n-1个虚拟变量,否则会造成完全共线性。未引入的即为对照组。下面是以单身男性为对照组的回归结果: 自变量中包含多个虚拟变量 每个虚拟变量代表不同的分类 例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6) 不同性别和婚姻状况个体的样本回归方程 自变量中包含多个虚拟变量 每个虚拟变量代表不同的分类 例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6) 根据研究关注问题的不同,可以选择不同的对照组。下面是以已婚女性为对照组的回归结果: 自变量包含多个虚拟变量 若干个虚拟变量代表同一种分类,且这种分类是定类的 例题7_5:工资的地区差异 northcen=1表示中北部地区 west=1表示西部地区 south=1表示南部地区 other_region=1表示其他地区 同样地,如果有n种分类,回归时只能引入n-1个虚拟变量! 自变量中包含多个虚拟变量 若干个虚拟变量代表同一种分类,且这种分类是定类的 例题7_5:工资的地区差异——以其他地区为对照组 自变量中包含多个虚拟变量 若干个虚拟变量代表同一种分类,且这种分类是定类的 例题7_5:工资的地区差异——以南部为对照组 自变量包含多个虚拟变量 若干个虚拟变量代表同一种分类,且这种分类是定序的 例题7_6:法学院排名对起薪的影响(课本p224,例7.8) 共引入6个虚拟变量表示法学院排名 自变量中包含多个虚拟变量 若干个虚拟变量代表同一种分类,且这种分类是定序的 例题7_6:如果有n种排序,回归时引入的虚拟变量数目应少于n,下面是以排名在100名以后的为对照组的回归结果 自变量中包含多个虚拟变量 若干个虚拟变量代表同一种分类,且这种分类是定序的 例题7_6:以排名在26-60名的为对照组 另外,参看课本p223,例7.7 交互项 含有虚拟变量

文档评论(0)

liudao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档