第七章 虚拟变量(精品·公开课件).ppt

第七章 虚拟变量(精品·公开课件).ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 虚拟变量回归 第一节 虚拟变量的性质 一、基本概念 由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量(dummy variable)。虚拟变量也称:哑元变量、定性变量等等。通常用字母D或DUM加以表示(英文中虚拟或者哑元Dummy的缩写)。 用1表示具有某一“品质”或属性,用0表示不具有该“品质”或属性。 虚拟变量使得我们可以将那些无法定量化的变量引入回归模型中。 虚拟变量应用于模型中,对其回归系数的估计与检验方法和定量变量相同。 虚拟变量表示两分性质,即“是”或“否”,“男”或“女”等。 例1:你在研究学历和收入之间的关系,在你的样本中,既有女性又有男性,你打算研究在此关系中,性别是否会导致差别。 例2:你在研究某省家庭收入和支出的关系,采集的样本中既包括农村家庭,又包括城镇家庭,你打算研究二者的差别。 例3:你在研究通货膨胀的决定因素,在你的观测期中,有些年份政府实行了一项收入政策。你想检验该政策是否对通货膨胀产生影响。 上述各例都可以用两种方法来解决,一种解决方法是分别进行两类情况的回归,然后看参数是否不同。另一种方法是用全部观测值作单一回归,将定性因素的影响用虚拟变量引入模型。 二、虚拟变量设置规则 虚拟变量的设置规则涉及三个方面: 1.“0”和“1”选取原则 虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。 从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。 “0”代表基期(比较的基础,参照物);“1”代表报告期(被比较的效应)。 例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“1”,女性为“0”。 2.属性(状态、水平)因素与设置虚拟变量数量的关系 定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。 虚拟变量数量的设置规则 1.若定性因素具有 m(m≥2) 个相互排斥属性(或几个水平),当回归模型有截距项时,只能引入m个虚拟变量; 2.当回归模型无截距项时,则可引入m个虚拟变量;否则,就会陷入“虚拟变量陷阱”。 例 (虚拟变量陷阱) 研究居民住房消费支出 和居民可支配收入xi 之间的数量关系。回归模型的设定为: 现在要考虑城镇居民和农村居民之间的差异,如何办? 为了对 “城镇居民”、“农村居民”进行区分,分析各自在住房消费支出 上的差异,设 为城镇; 为农村。 ,则模型为 (模型有截距,“居民属性”定性变量只有两个相互排斥的属性状态( m=2),故只设定一个虚拟变量。) 若对两个相互排斥的 “居民属性” ,引入m=2个虚拟变量,则有 则模型(1)为 则对任一家庭都有: D1+D2=1 即产生完全共线,陷入了“虚拟变量陷阱”。“虚拟变量陷阱”的实质是:完全多重共线性。 第二节 虚拟解释变量的回归 在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种: 实质:加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。 一、加法类型 (1)一个两种属性定性解释变量而无定量变量的情形 例:按性别划分的教授薪金 (2)包含一个定量变量,一个定性变量模型 设有模型,yt = ?0 + ?1 xt + ?2D + ut , 其中yt,xt为定量变量;D为定性变量。当D = 0 或1时,上述模型可表达为, ?0 + ?1xt + ut , (D = 0) yt = (?0 + ?2) + ?1xt + ut , (D = 1) D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若?2显著不为零,说明截距不同;若?2为零,说明这种分类无显著性差异。 注意: 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。但解释模型时一定注意1,0是怎样分配的。 ②定性变量中取值为0所对应的类别称作基础类别(base category)。 (3)一个定性解释变量(两种以上属性)和一个定量解释变量的情形 (4)两个定性解释变量(均为两种属性)和一个定量解释变量的情形 例:研究大学教师的年薪是否受到性别、学历的影响。性别和

文档评论(0)

秦圈圈 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档