- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
尚辅网 / 第六章 虚拟变量的回归 虚拟变量(Dummy Variable),又称名义变量。 另外还有一些名称是: 指标变量(Indicator Variable) 、 二值变量 (Binary Variable) 、定性变量(Qualitative Variable) 和二分变量(Dichotomous Variable)。 这些都指的是一个取值为0或1的变量。 第一节 虚拟变量 一、 作为解释变量的虚拟变量 对于线性回归模型 其中 在回归分析中,被解释变量不仅常受一些在尺度上明确量化好的解释变量的影响,而且还受实质上是定性性质的变量的影响。 在这种情况下,不能简单地用最小二乘法进行参数 估计,需要另一些模型来研究。 当D作为被解释变量时,我们就可以对以下线性 回归模型进行分析: 二、 作为被解释变量的虚拟变量 虚拟变量不仅可作为解释变量,它也可作为被解 释变量,例如银行研究是否给企业贷款,结果只有两个: 贷或不贷。 三、虚拟变量模型的类型和解释变量个数的选择 (一)含虚拟变量回归模型的分类 1.ANOVA模型 一个回归模型可以只含有虚拟变量或定性的解释 变量, 这一类模型称为方差分析(Analysis-of-variance, 简记为ANOVA)模型。 2.ANCOVA模型 兼含有定量和定性解释变量的回归模型叫做协方差 分析 (Analysis-of-covariance,简记ANCOA)模型。 例[6-2] (二)虚拟变量个数的选取规则 1. (虚拟变量个数的选取)问题的提出 2. 虚拟变量个数的选取 一般的规则是: 如果一个定性变量有m个类别,则只需引入m-1个 虚拟变量。 例子: 为了区分两个类别:男性和女性,我们只需引进了一个虚拟变量D。 解决多重共线性问题的方法有各种各样,最简单的方 法就是当定性变量有两个分类或两个水平时,仅用一个 虚拟变量 。 3. 虚拟变量有关名词的定义 (1) 基底 虚拟变量被赋予零值的那个组别、类别或级别 常被喻为是基底(base)、基准(benchmark)、 对比(comparison)、参考(reference)或省略(omitted) 类。 共同的截距项就是基底类的截距 (2) 级差截距系数 附着于虚拟变量Di ,的系数 称为级差截距系数 (differential intercept coefficient) 四、 一个定量变量和一个多分定性变量的回归 在横截面数据的基础上,做个人保健支出对个人 收入和教育水平的回归,考虑三个互相排斥的教育水平: 低于中学、中学和大学 。 按照虚拟变量的个数比变量分类数少一的规则,我 们需要引进两个虚拟变量,以处理教育的三个水平。 其中, 表示保健年度支出, 表示年度收入 , 五、 一个定量变量和多个定性变量的回归 (一) 一个定量变量和两个定性变量的回归 (二) 一个定量变量和多个定性变量的回归 虚拟变量的方法易于推广,以便处理多于一个定性 变量的情况。在学院教授的薪金回归模型(6.1.4)中,除了教龄和性别之外,如果肤色也是一个重要的薪金决定因素。则模型需要改为(6.1.14)。 多个定量变量和多个定性变量的回归与一个定量变 量和两个定性变量的回归没有本质的区别,这里只给出 一个例子加以说明。例[6-3] 第二节 虚拟变量的应用 一、 应用虚拟变量改变回归直线的截距 二、应用虚拟变量改变回归直线的斜率 三、分段线性回归 图6—2表示两种情况下,中国通货膨胀率的变化的 情况。 我们仍然研究通货膨胀率和国民总产值增长率之间的相互关系,这一回假设1998年与普通年份的预期基点相同,但变化幅度不同,也就是斜率不同。 虚拟变量的另一个用途,可以从图6-4看出。 例[6-4] 四、 检验回归模型结构的稳定性 一般情况两个或两个以上回归方程的差异在于 截矩,也许在于斜率或者两者都有。 设重建时期收入与储蓄的理论模型为: 设重建后时期收入与储蓄的理论模型为: (一)回归模型的结构的稳定性问题的提出 1、 和 就是说两个回归相同(重合回归 Coincident regression) 2、 但 就是说两个回归的差异仅在于位置即
文档评论(0)