- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
虚拟变量的常见应用 描述不同类型的数量规律 定性因素间的交互作用 如前例:黑女人并未受到双重歧视 多种类别的定性变量 控制时间特征 季节虚拟变量 年份虚拟变量,长期的序列分为二、三段 制度效应:大小非,国八条 第六章 虚拟变量回归 一、虚拟变量的基本含义 二、虚拟变量的引入 三、虚拟变量的设置原则 * 一、虚拟变量的基本含义 许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等 但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”, * 四種测量的分类模式 定量的 定性的 连续的or定距的 interval 离散的 次序的ordinal 名义的nominal 分类变量 这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。 例如,反映文程度的虚拟变量可取为: 1, 本科学历 D 0, 非本科学历 一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为1; 比较类型,否定类型取值为0。 * 概念: 同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。 一个以性别为虚拟变量考察企业职工薪金的模型: 其中:Yi为企业职工的薪金,Xi为工龄, Di 1,若是男性,Di 0,若是女性。 * 二、虚拟变量的引入 虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。 企业男职工的平均薪金为: 上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。 1、加法方式 * 企业女职工的平均薪金为: 几何意义: 假定?2 0,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差?2。 可以通过传统的回归检验,对?2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。 ?0 ?2 * 例题6-1:男女食品支出和税后收入的关系。P134 (6-4)被解释变量:食品支出; 解释变量:性别 (6-9)被解释变量:食品支出; 解释变量:税后收入、性别 * (6-23) 被解释变量:食品支出; 解释变量:税后收入、性别、税后收入*性别 * 1、分别写出(6-4)、(6-9)的估计方程。 2、进一步写出男性、女性的估计方程。 3、根据估计结果,解释偏回归系数含义。 Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob.?? C 3176.833 233.0446 13.63187 0.0000 SEX -503.1667 329.5749 -1.526714 0.1578 R-squared 0.189026 (6-4)被解释变量:食品支出;解释变量:性别 Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob.?? C 2673.667 233.0446 11.47277 0.0000 SEX2 503.1667 329.5749 1.526714 0.1578 R-squared 0.189026 性别赋值:男性 1,女性 0; 性别赋值:男性 0,女性 1; * Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 1506.244 188.0096 8.011529 0.0000 INCOME 0.058982 0.006117 9.641745 0.0000 SEX -228.9868 107.0582 -2.138899 0.0611 R-squared 0.928418 (6-9)被解释变量:食品支出; 解释变量:税后收入、性别 * 例2:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。 教育水平考虑三个层次:高中以下, 高中, 大学及其以上 模型可设定如下: 这时需要引入两个虚拟变量: * 在E ?i 0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数: 高中以下: 高中: 大学及其以上: 假定?3 ?2,其几何意义: * 可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。 例4:如在上述职工薪金的例中,再
文档评论(0)