- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
经济计量学 Chp 10 虚拟变量回归模型 主要内容 虚拟变量的性质 ANCOVA模型 包含一个定量变量、一个多分定性变量的回归 包含一个定量变量和多个定性变量的回归 回归的比较 虚拟变量在季节分析中的应用 应变量也是虚拟变量的情形:LPM 小结 一、虚拟变量的性质 许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等——称之为定量变量, quantitative (numerical) explanatory variables 。 但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响等——称之为定性变量, qualitative explanatory variables 。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。 定性变量通常表示为具备或不具备某种性质,如男性或女性;黑人或白人;党员或非党员等。 把定性因素“定量化”的一个方法是建立人工变量(也称为虚拟变量,Dummy variable),并赋值0和1: 0:不具备某种性质; 1:具备某种性质。 虚拟变量常用变量D表示。 例如,反映文化程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历 一般地,在虚拟变量的设置中: 研究类型、肯定类型取值为1; 基准类型,否定类型取值为0。 称虚拟变量也为二元变量binary variable 方差分析模型(Analysis of variance models,ANOVA):仅包含定性变量或虚拟变量的回归模型,其形式如下: Yi=B0+B1Di+ui 假定Y:每年食品支出(美元);Di=1表示女性;Di=0表示男性,则: 男性食品支出的期望:E(Yi|Di=0)=B0 女性食品支出的期望: E(Yi|Di=0)=B0+B1 上述模型的含义: 截距B0表示男性平均食品支出,斜率系数B1表示女性平均食品支出与男性的差异, B0+ B1表示女性平均食品支出。 对这类模型,零假设为:H0:B1=0 表示男女平均食品支出没有差异。我们可根据t检验判定是否统计显著。 例10-1(P213):性别差异对食品消费支出的影响 公式:10-4 or 10-5 几个问题: 1. 基准类(benchmark group)(基础类base group,参照类或比较类):取值为0的那类变量 基准类的选择根据研究目的而定 来自于社会学、心理学等研究的需要 2. 虚拟变量D的系数称为差别截距系数(differential intercept coefficient), 表明了取值为1的类的截距值与基准类截距值的差距。 几个问题: 3. 虚拟变量陷阱(完全共线性)或多重共线性 在解释变量存在完全共线性的情形下,不可能得到参数的惟一估计值。 例如前例: Yi=B1+B2D2i+B3D3i+ui 其中,D2=0,D3=1;D2=1,D3=0 避免“陷阱”的一般原则:如果模型有共同的截距项,且定性变量有m种分类,则需引入m-1个虚拟变量。 例10-2(P215):工会化程度与工作权利法 本例研究工作权利法(是否通过)对私营部分的工会化程度的影响 二、协方差分析模型(ANCOVA)——:包含一个定量变量和一个两分定性变量的回归 例:考虑可支配收入(定量变量)与性别食品消费支出对的回归模型 回归模型如公式10-8,10-9 对模型的解释: 虚拟变量的统计显著; 常数统计显著; 对定量变量回归统计的解释。 对比没有虚拟变量的模型 例:一个以性别虚拟变量考察企业职工薪水的模型: Yi=B1+B2Xi+B3Di+ui 三、包含一个定量变量、一个多分定性变量的回归 例:考查学生支出和地区差异(三个地区,分别是东北和中北部(21)、南部(17)和西部(13))对教师薪水的影响 先考虑地区差异模型如下:AASi=B1+B2D2i+B3D3i+ui 其中,AAS为公立学校老师平均年薪水;Di为虚拟变量,且 D2=1表东北和中北部地区,D2=0为其它地区; D3=1表南部地区,D3=0为其它地区 这是将西部地区看成是基准类。 再考虑政府机构用于每个学生的花费和地区对教师平均年薪水的影响:AASi=B1+B2D2i+B3D3i+B4PPSi 对模型的解释: D2显著,而D3不显著,表明原模型存在设定误差; PPS的系数的含义 四、包含一个定量变量和多个定性变量的回归 例:考虑如下回归模型: Yi=B1+B2D2i+B3D3i+B4Xi+ui 其中: Y=小时工资(美元) X=教育(受教育年限) D2=1(女性),0(男性) D3=1(非白种人和非西班牙人),0(其他) 结果:P221 对模型的解释: 本例的基准类是白种或西班
文档评论(0)