计量经济学(第四版)3.6 虚拟变量模型.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§3.6 含有虚拟变量的多元线性回归模型 一、含有虚拟变量的模型 一、虚拟变量的引入 二、虚拟变量的设置原则 由变量显著性检验得到:在10%的显著性水平下,Di和DiXi1是显著的,而DiXi2不显著。因此: 2013年农村居民的平均消费支出要比城镇居民少1573.9元; 在其他条件不变的情况下,农村居民与城镇居民的工资收入都增加100元时,农村居民要比城镇居民多支出19元用于生活消费; 农村居民与城镇居民在其他收入方面有相同的增加量时,两者增加的消费支出没有显著差异。 讨论:定序定性变量可否按照状态赋值? 例如:表示居民对某种服务的满意程度,分5种状态:非常不满意、一般不满意、无所谓、一般满意、非常满意。在模型中按照状态分别赋值0、1、2、3、4或者-2、-1、0、1、2。 被经常采用,尤其在管理学、社会学研究领域。 正确的方法: 设置多个虚拟变量,理论上正确,带来自由度损失。 以定性变量为研究对象,构造多元排序离散选择模型,然后以模型结果对定性变量的各种状态赋值。但需要更多的信息支持。 赋值的方法等于是对虚变量方法中的各个虚变量的参数施加了约束,而这种约束经常被检验为错误的。 * 一、含有虚拟变量的模型 1、虚拟变量(dummy variables) 许多经济变量是可以定量度量。 一些影响经济变量的因素是无法定量度量。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。 虚拟变量只作为解释变量。 一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为1; 比较类型,否定类型取值为0。 例如,反映文程度的虚拟变量可取为: D=1,本科学历 D=0,非本科学历 虚拟变量能否取1、0以外的数值? 2、虚拟变量模型 同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。 例如,一个以性别为虚拟变量考察企业职工薪金的模型: 其中:Yi为企业职工的薪金;Xi为工龄; Di=1,若是男性,Di=0,若是女性。 二、虚拟变量的引入 1、加法方式 虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。 上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。 在该模型中,如果仍假定E(?i)=0,则企业男、女职工的平均薪金为: 假定?20,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差?2。 可以通过对?2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。 ?0 ?2 将上例中的性别换成教育水平,教育水平考虑三个层次:高中以下、高中、大学及其以上。 高中以下 高中 大学及以上 在上例中同时引入性别和教育水平: 女职工本科以下学历的平均薪金: 女职工本科以上学历的平均薪金: 男职工本科以下学历的平均薪金: 男职工本科以上学历的平均薪金: 2、乘法方式 加法方式引入虚拟变量,考察:截距的不同。 许多情况下,斜率发生变化,或斜率、截距同时发生变化。 斜率的变化可通过以乘法的方式引入虚拟变量来测度。 例如,根据消费理论,收入决定消费。但是,农村居民和城镇居民的边际消费倾向往往是不同的。这种消费倾向的不同可通过在消费函数中引入虚拟变量来考察。 农村居民: 城镇居民: 3、同时引入加法与乘法形式的虚拟变量 当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。 对于一元模型,有两组样本,则有可能出现下述四种情况中的一种: ?1=?1 ,且?2=?2 ,即两个回归相同,称为重合回归(Coincident Regressions); ?1??1 ,但?2=?2 ,即两个回归的差异仅在其截距,称为平行回归(Parallel Regressions); ?1=?1 ,但?2??2 ,即两个回归的差异仅在其斜率,称为汇合回归(Concurrent Regressions); ?1??1,且?2??2 ,即两个回归完全不同,称为相异回归(Dissimilar Regressions)。 4、例题 判断中国农村居民与城镇居民的消费行为是否有显著差异。 被解释变量:居民家庭人均生活消费支出Y 解释变量:居民家庭人均工资收入X1、其他收入X2 样本:2013年31个地区农村居民与城镇居民人均数据 虚拟变量Di:农村居民取值1,城镇居民取值0 总体回归模型 样本回归函数 三、虚拟变量的设置原则 每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状态类别数(categories)少

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档