- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 虚拟变量;第一节 虚拟变量;虚拟变量是用以反映质的属性的一个人工变量,取值为 0 或 1,通常记为 D(Dummy Variable),又可称之为属性变量、双值变量、类型变量、定性变量、或二元型变量。
注意:虚拟变量D只能取0或1两个值,即属性之间不能运算!
对基础类型或否定类型设 D=0
对比较类型或肯定类型设 D=1;例 如;说 明;二、虚拟变量的设置规则;2.多个属性的表示法
假设学历有四个属性:博士、硕士、本科、本科以下等,则:; 变量
属性;3.多个因素各两个属性的表示法
如需要同时表示城乡差别和性别差别;一般地,若有m个因素,而每个因素都只有两个不同的属性类型,则引入m个虚拟变量。
思考:现有三个定性因素,有两个因素各有4个不同的属性,一个因素有2个不同的属性,应设多少个虚拟变量?
(应设3+3+1=7个虚拟变量);三、虚拟变量的作用;四、虚拟变量模型;一、加法类型(截距变动模型)
;;如研究消费水平与居民收入的关系时,还要考虑城乡居民消费水平的差异,消费函数可设为:
Yi=α0+α1Di+βXi+ ui
Yi 为消费水平,Xi 为居民收入,Di为虚拟变量。;表示农村居民的消费水平;Xi;对模型 Yi=α0+α1Di+βXi+ ui 使用OLS法,可得: ;假如还要考虑男女消费水平的差异,消费函数为:
Yi =α0+α1D1i+α2D2i+βXi+ui
Yi 为消费水平,Xi 为家庭收入,D1i和D2i为虚拟变量。;表示城市男性的消费水平;Xi;虚拟变量陷阱
如某些商品的销售量有季节性,假设销售函数为:;;克服虚拟变量陷阱的方法
改为引入虚拟变量:;引入虚拟变量的规则补充说明
对于具有m个属性的虚拟变量:
若模型中含有截距项,引入 m-1个虚拟变量;
若模型中不含有截距项,引入 m 个虚拟变量。;二、乘法类型(斜率变动模型);1、回归模型的比较;分别在各自的时间区间内作回归,可能有如下四种结果:;Xi;Xi;Xi;Xi;问题:当我们分别运用样本数据对两个模型进行回归后,如何界定所得结果在统计意义上属于那种类型呢?
可采用乘法形式引入虚拟变量,可设定为:;(1)改革开放前;从上面可以看出,以乘法形式引入虚拟变量做回归模型的比较的优点:
(1)用一个回归代替多个回归,简化过程;
(2)可以对模型结构差异做假设检验;
(3)合并的模型增加了自由度,提高了参数
估计的精确性。
当然,也应注意合并后模型的随机扰动项应服从基
本假定,特别是所比较的方程的方差应相同,否则
会出现异方差。; 在多元线性回归模型中,通过F检验,可以判断各解释变量联合对被解释变量是否有显著影响。那么在包含两个定性变量的虚拟变量模型中,两个定性变量对被解释变量的影响也可能存在一定的交互作用,如何描述呢?
例如,研究农副产品生产总收益与农副产品生产投入的关系时,设定模型为;虚拟变量以加法形式引入暗含着假设:油菜籽生产和养蜂生产是分别独立地影响着农副产品总收益。但实际是在发展油菜籽生产的同时发展养蜂生产,所取得的农副产品总收益会高于不发展养蜂生产的情况。即它们之间存在交互作用。;为了描述交互作用对被解释变量的影响,在模型中引入虚拟变量的乘积,即;在经济关系中常有这样的情况:
当解释变量X的值达到某一水平X*之前,与被解释变量Y之间存在某种线性关系;当解释变量X的值达到或超过X*之后,与被解释变量Y的关系就会发生变化。此时,如果已知X 的转折点X*,就可以用虚拟变量来估计每一段的斜率。这就是分段线性回归。;例如:1979年以前,我国居民的消费支出呈缓慢上升的趋势。从1979年开始,居民消费支出为快速上升趋势。
显然,1979年是一个转折点,即:
X*=1979
所以,可用模型描述我国居民在1955年至2009年消费支出的变动趋势:;Yt=β0 +β1t +β2(t- X*)Dt + ut
其中 Yt 为消费支出;
t 为年份(t=1955,1956,…,2009);;t (年份);只要检验β2的统计显著性,就可以判断在所设定的临界水平X*处是否存在“突变”。
可以推广到 k 段回归的情况,只需用 k-1个虚拟变量即可。 ;第三节 虚拟被解释变量;一、线性概率模型;则Yi 是取值0或1的随机变量,由(1)式得:;2、线性概率模型的估计
线性概率模型虽然在形式上与普通线性回归
模型很相似,但由于Yi 是虚拟变量,会出现
与普通回归模型不同的新问题,不能直接运
用OLS对其进行估计:
(1)随机扰动项不服从正态分布;
(2)随机扰动项具有异方差性;
(3)条件0≤E(Yi︱Xi)≤1不一定
文档评论(0)