- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Economics 20 - Prof. Anderson Dummy Variables A dummy variable is a variable that takes on the value 1 or 0 Examples: male (= 1 if are male, 0otherwise), south (= 1 if in the south, 0 otherwise), etc. Dummy variables are also called binary variables, for obvious reasons A Dummy Independent Variable Consider a simple model with one continuous variable (x) and one dummy (d) y = b0 + d0d + b1x + u This can be interpreted as an intercept shift If d = 0, then y = b0 + b1x + u If d = 1, then y = (b0 + d0) + b1x + u The case of d = 0 is the base/benchmark group 例7.1 是否存在性别歧视 例7.2 拥有计算机 与大学GPA 例7.3 培训津贴对培训小时数的影响 当因变量为log(y)时对虚拟变量系数的解释 当自变量中有一个或多个虚拟变量时,因变量以对数形式出现,虚拟变量的系数具有一种百分比解释。 当y有较大比例变化时,如何更准确估计y变化的百分比? Dummies for Multiple Categories 在应用研究中,我们需要使用多个虚拟变量。 在控制性别的基础上,研究婚姻状态的影响; 在区域研究中,往往区分东、中、西部;在省级面板数据中,甚至会引入n-1个地区虚拟变量。 虚拟变量可以描述包含序数的信息:信用等级 例7.6 工资方程 如果要比较特定两组之间工资的差异,可以重新设定基组进行回归分析。例如,为检验单身女人和已婚女人之间的估计差异是否显著,以已婚女人组作为基组重新估计得到: 在方程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。 通过虚拟变量来包含序数信息 序数变量:穆迪或标准普尔对地方政府债券的质量进行了级别评定,假设等级范围从零到四,零为最低的信用等级,四位最高的信用等级,记为CR。然而,很难有意义地解释CR变化一个单位对MBR的影响。 例7.7 相貌吸引力对工资的影响 在劳动力市场中,除了存在性别歧视之外,还可能存在相貌、身高等歧视。如果将样本相貌分为三类:一般水平、低于一般水平、高于一般水平,并以一般水平组作为基组,分别对男人、女人估计方程得: 例7.8 法学院排名对起薪的影响 涉及虚拟变量的交互作用 虚拟变量之间的交互作用 例7.6根据婚姻状况和性别定义了四个类别,在模型中引入三个虚拟变量,以单身男性为基组研究了不同类别之间的工资差异。除此之外,还有什么方法? 此外,我们还可以在female和married分别出现的模型中,增加一个female和married的交互项,同样可以进行组别工资差异比较。 例7.9 计算机使用对工资的影响 容许出现不同的斜率 虚拟变量之间的交互项反映的是截距之间的差异,斜率并未发生变化。含义是:样本回归曲线是平行的。 虚拟变量与非虚拟变量之间也有交互作用,使得出现不同的斜率。 我们关心的两个假设: 男性和女性受教育的回报是相同的。 受教育水平相同的男性和女性的平均工资相同。 例7.10 对数小时工资方程 检验不同组之间回归函数上的差别 现在,我们考察的虚拟假设是:两个总体或两组具有同一个回归函数;对立假设是,各组间有一个或多个斜率是不同的。 一般的检验方法:邹至庄统计量 邹至庄检验的步骤: 确立回归的一般模型,明确受约束模型和不受约束模型的自由度。(约束个数:k+1) 分别将两组进行回归得到SSR1和SSR2。 将两组数据混合并重新估计模型得到受约束模型的残差平方和SSR. 运用公式计算邹统计量,检验显著性水平。 7.5 二值因变量:线性概率模型 迄今为止,我们讨论的因变量均具有定量的含义。如果用多元回归解释一个定性事件,需引入二值因变量,即y只取0和1两个值。例如,y表示一个成年人是否受过高中教育,或一个大学生在给定年份是否用过非法毒品等。 7.6 对政策分析和项目评价的进一步讨论 ——内生性问题 在社会科学研究中,对照组和处理组并不是随机指定的,因此可能遭遇变量内生性问题。 自选择(self
文档评论(0)