网站大量收购闲置独家精品文档,联系QQ:2885784924

第八章虚拟变量1577775632.pptx

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 虚拟变量;第一节 虚拟变量;虚拟变量是用以反映质的属性的一个人工变量,取值为 0 或 1,通常记为 D(Dummy Variable),又可称之为属性变量、双值变量、类型变量、定性变量、或二元型变量。 注意:虚拟变量D只能取0或1两个值,即属性之间不能运算! 对基础类型或否定类型设 D=0 对比较类型或肯定类型设 D=1;例 如;说 明;二、虚拟变量的设置规则;2.多个属性的表示法 假设学历有四个属性:博士、硕士、本科、本科以下等,则:; 变量 属性;3.多个因素各两个属性的表示法 如需要同时表示城乡差别和性别差别;一般地,若有m个因素,而每个因素都只有两个不同的属性类型,则引入m个虚拟变量。 思考:现有三个定性因素,有两个因素各有4个不同的属性,一个因素有2个不同的属性,应设多少个虚拟变量? (应设3+3+1=7个虚拟变量);三、虚拟变量的作用;四、虚拟变量模型;一、加法类型(截距变动模型) ;;如研究消费水平与居民收入的关系时,还要考虑城乡居民消费水平的差异,消费函数可设为: Yi=α0+α1Di+βXi+ ui Yi 为消费水平,Xi 为居民收入,Di为虚拟变量。;表示农村居民的消费水平;Xi;对模型 Yi=α0+α1Di+βXi+ ui 使用OLS法,可得: ;假如还要考虑男女消费水平的差异,消费函数为: Yi =α0+α1D1i+α2D2i+βXi+ui Yi 为消费水平,Xi 为家庭收入,D1i和D2i为虚拟变量。;表示城市男性的消费水平;Xi;虚拟变量陷阱 如某些商品的销售量有季节性,假设销售函数为:;;克服虚拟变量陷阱的方法 改为引入虚拟变量:;引入虚拟变量的规则补充说明 对于具有m个属性的虚拟变量: 若模型中含有截距项,引入 m-1个虚拟变量; 若模型中不含有截距项,引入 m 个虚拟变量。;二、乘法类型(斜率变动模型);1、回归模型的比较;分别在各自的时间区间内作回归,可能有如下四种结果:;Xi;Xi;Xi;Xi;问题:当我们分别运用样本数据对两个模型进行回归后,如何界定所得结果在统计意义上属于那种类型呢? 可采用乘法形式引入虚拟变量,可设定为:;(1)改革开放前;从上面可以看出,以乘法形式引入虚拟变量做回归模型的比较的优点: (1)用一个回归代替多个回归,简化过程; (2)可以对模型结构差异做假设检验; (3)合并的模型增加了自由度,提高了参数 估计的精确性。 当然,也应注意合并后模型的随机扰动项应服从基 本假定,特别是所比较的方程的方差应相同,否则 会出现异方差。; 在多元线性回归模型中,通过F检验,可以判断各解释变量联合对被解释变量是否有显著影响。那么在包含两个定性变量的虚拟变量模型中,两个定性变量对被解释变量的影响也可能存在一定的交互作用,如何描述呢? 例如,研究农副产品生产总收益与农副产品生产投入的关系时,设定模型为;虚拟变量以加法形式引入暗含着假设:油菜籽生产和养蜂生产是分别独立地影响着农副产品总收益。但实际是在发展油菜籽生产的同时发展养蜂生产,所取得的农副产品总收益会高于不发展养蜂生产的情况。即它们之间存在交互作用。;为了描述交互作用对被解释变量的影响,在模型中引入虚拟变量的乘积,即;在经济关系中常有这样的情况: 当解释变量X的值达到某一水平X*之前,与被解释变量Y之间存在某种线性关系;当解释变量X的值达到或超过X*之后,与被解释变量Y的关系就会发生变化。此时,如果已知X 的转折点X*,就可以用虚拟变量来估计每一段的斜率。这就是分段线性回归。;例如:1979年以前,我国居民的消费支出呈缓慢上升的趋势。从1979年开始,居民消费支出为快速上升趋势。 显然,1979年是一个转折点,即: X*=1979 所以,可用模型描述我国居民在1955年至2009年消费支出的变动趋势:;Yt=β0 +β1t +β2(t- X*)Dt + ut 其中 Yt 为消费支出; t 为年份(t=1955,1956,…,2009);;t (年份);只要检验β2的统计显著性,就可以判断在所设定的临界水平X*处是否存在“突变”。 可以推广到 k 段回归的情况,只需用 k-1个虚拟变量即可。 ;第三节 虚拟被解释变量;一、线性概率模型;则Yi 是取值0或1的随机变量,由(1)式得:;2、线性概率模型的估计 线性概率模型虽然在形式上与普通线性回归 模型很相似,但由于Yi 是虚拟变量,会出现 与普通回归模型不同的新问题,不能直接运 用OLS对其进行估计: (1)随机扰动项不服从正态分布; (2)随机扰动项具有异方差性; (3)条件0≤E(Yi︱Xi)≤1不一定

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档