6 含虚拟变量的回归模型.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6 含虚拟变量的回归模型 一、虚拟变量的定义 1.解释变量的分类: 定量变量:反映数量大小的变量;如收入,产量,价格,成本等。一般用X 表示。 定性变量:又称属性变量 ,很难直接度量其大小,如性别,种族,职业,受教育水平,季节,战争, 地震,罢工等。一般用D 表示。 2 .由于定性变量常指某一“性质”或“属性”出现或不出现,因此“量化”这些变量的一个方法是构造一 个取值为1 或0 的人为变量,即: 1: 具备某一属性; D  0:不具备某一属性 取这样的1 或0 值的变量叫做虚拟变量(Dummy Variables )。另外,还称为指示器变量(indicator variables), 二进制变量(binary variables),定性变量(qualitative variables),分类变量(categorical variables),二分变量 厦门大学经济学院 胡朝霞 (dichotomous variables)等。 例: 1: 男 1: 大学毕业 D  ; D  0:女 0:非大学毕业 二、方差分析模型(ANOVA ) 当模型中的解释变量只有虚拟变量时,称为方差分析模型(analysis of variance models )。 例:分析大学毕业生和非大学毕业生的初职年薪是否存在差异。 假设设定以下回归模型: Y b b D u i 1 2 i i 其中,Y 表示初职年薪; 1: 大学毕业  D  0:非大学毕业 也应是说,对于大学毕业生而言,其D =1,代入模型中可得: 厦门大学经济学院 胡朝霞 Y b b u ,其期望值为:E(Y ) b b i 1 2 i i 1 2 对于非大学毕业生而言,其D =0,代入模型可得: Y b u , 其期望值为:E(Y ) b i 1 i i 1 也就是说,原模型是假设大学毕业生的初值年薪与非大学生的初职年薪显著不同,其平均差距为虚拟变 量D 的系数b2 。 被赋予零值的那个类别被称为是基底或基准(base,benchmark) ,也就是说,它被用于和其它类别比较 的基础。共同的截距项b1 就是基底类的截距项。 虚拟变量D 的系数b2 被称为级差截距系数(differential intercept coefficient ),它告诉我们取值为1 的 类别的截距值和基底类的截距值相比有多少差别。 虚拟变量显著性检验:t 检验显著表明虚拟变量被赋予1 值的分类与基底类的差异是显著的。 Example 6.1 如果方差分析模型中的因变量实际上还受其他的定量变量的影响,则原来的方差分析模型存在模型的设 定偏差。 Example 6.2 厦门大学经济学院 胡朝霞 三、包含一个定量变量,一个虚拟变量的回归模型 在经济学的分析中,很少使用前面提到的方差分析模型,,更多的是用到既有定量变量,又有虚拟变量作 为解释变量的回归模型,这样的回归模型称为协方差分析模型(ANCOVA )。 例:分析大学教师的工资的主要影响因素。 设定以下回归模型: Y b b D b X u i 1 2 i 3 i i 其中,Y 为大学教师的年薪;X 为教龄; 1: 男教师; Di  0:女教师 这个模型认为,大学教师的年薪主要受两个因素的影响,一个是教龄,另一个是性别。 并且假设性别 只对大学教师年薪的截距产生影响,年薪对教龄的变化率不受性别影响(即男女教师具有相同的斜率)。 可以将以上模型分解为: 女教师的年薪模型:D =0 厦门大学经济学院 胡朝霞 Y b b X u 截距为:b1

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档