第七章节_虚拟变量.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章节_虚拟变量

第七章 虚拟变量 Dummy variables 本章将主要考虑虚拟的自变量的情况,即解释变量出现虚拟变量。 在现实中,模型中可能会出现一些定性的变量作为解释变量。通常将虚拟变量取值0或1,所以虚拟变量又称为二分变量,用虚拟变量来表示某一性质或属性出现或不出现。 例如:收入决定模型中,除了可以量化的工作年限和受教育年限这两个变量以外,我们还包括了性别这一定性的变量,用0表示女性,1表示男性。模型可以写成: y= α +β1 x + β2 D +μ 其中,D为虚拟变量 D=0,表示女性, D=1表示男性 模型中加入虚拟变量后,更加贴近经济的真实情况,也更加灵活,收入决定模型我们不仅要考察一般人口的状况,也关注不同性别的收入决定模型的差异,从而更有利于政策的制定和调整。 一般情况下,一个定性变量所需要的虚拟变量的个数取决于该定性的变量的类别,如果有n个类别,所引进的虚拟变量的个数时m-1,比总体类别的数量少1。例如性别变量,分为两类男性或女性,需要一个虚拟变量就可以了;如果地区发展问题,考虑地区差异,假设把全国分为东部,中部和西部,就需要2个虚拟变量,令 1 东部 D1= 0 其他 1 中部 D2= 0 其他 全集分为三类,所以需要两个虚拟变量。 第一节 临时虚拟 为了更好地对模型进行估算,经常要在模型中排除一些又突发时间产生的异常值(outlier),及其对模型的影响,例如战争、地震、内乱、罢工等。 例如:y= α +β1 x + β2 D +μ 其中,D为临时虚拟变量 D=1,异常时期 D=0,平时 例题 下表是日本1985-1995年水稻产量Y和耕种面积的数据X: 年份 产量(10万吨)Y 耕种面积(万公顷)X 116 232 116 228 106 212 99 209 103 208 105 206 96 203 105 209 78 213 120 220 107 211 (1)估计模型y= α +βx +μ (2)受1993年冻害的影响,水稻收成指数为战后最低,出现了歉收。因此设D=1为1993年,D=0为其他年份,估计下列模型y= α +β1 x + β2 D +μ 根据数据计算结果如下: ΣX=2351 ΣY=1151 ΣXY=246601 ΣX2=503313 ΣY2=121757 n=11 Y= -48.224 + 0.71521X (73.4) 0.3432) R2=0.3255 引入临时虚拟变量后,即1993年为异常年份,计算结果如下: ΣX=2351 ΣY=1151 ΣXY=246601 ΣX2=503313 ΣY2=121757 n=11 ΣD=1 ΣXD=213 ΣYD=78 Y= -40.292 + 0.69033X - 28.748D (30.90) (0.1444) (4.389) 经过校正的R2 =0.8675 如果直接去掉1993年的数据,回归的结

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档