- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 单方程回归模型的几个专题
8.1 虚拟变量(dummy variable)
8.1.1概念与用作
在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。 例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质等因素的影响。 这些因素也应该包括在模型中。为此人们采取了一种构造人工变量的方法,将这些定 性变量进行量化,使其能与数值变量一样在回归模型中得以应用。
构造的规则是当某种属性存在时, 人工变量取值为1;当某种属性不存在时时,取 值为0。在计量经济学中,我们把反映定性因素变化,取值为 0或1的人工变量称为 虚拟变量。习惯上用D表示。如:
1
k 1城镇居民
广
1男性
"1就业
D= Y
D= Y
D= Y
?0农村居民
0女性
.0失业
引入虚拟变量的作用主要有三个:1)可以描述定性因素的影响;2)能够正确反 映经济变量的相互关系,提高模型的精度;3)便于处理异常数据。当样本资料中存在 异常数据时,一般有三种处理方式。一是直接剔除;二是平滑掉;三是设置虚拟变量。
8.1.2虚拟变量的设置
1、设置规则
1) 一个因素多个属性:若定性因素有 M个不同的属性,或相互排斥的类型,在 模型中则只能引入M-1个虚拟变量,否则会引起完全多重共线性。
2) 多个因素多个属性:每个因素的引入方法均按上述原则。
2、引入方式:
1)加法方式(截距移动)
设有模型,
yt = :o + 1 xt + 2D + ut ,
其中yt, xt为定量变量;D为定性变量。当D = 0或1时,上述模型可表达为,
Bo中呂必+ut d =o
yt =丿
(氐 +02)+BiXt +U
(氐 +02)+BiXt +Ut D =1
为零,说明截距不同;若 p为零,说明这种分类无显著性差异。
y = - 100 + x - 5D =-05 + x-
y = - 100 + x - 5D =
-05 + x
-100 + x
注意:
若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性, 称作虚拟变量陷阱(dummy variable trap)。
关于定性变量中的哪个类别取 0,哪个类别取1,是任意的,不影响检验结果
定性变量中取值为0所对应的类别称作基础类别(base category。
对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值
不同的方法处理。如:
1 (大学)
0 仲学)
-1 (小学)。
例1:市场用煤销售量模型(file: Dummyl )
我国市场用煤销量的季节性数据(1982-1988,《中国统计年鉴》1987, 1989)见下 图与表。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是 季节数据可设三个季节变量如下:
D11 ( 4季度)0 ( 1,2, 3 季度)D255005000450040003500
D1
1 ( 4季度)
0 ( 1,2, 3 季度)
D2
5500
5000
4500
4000
3500
3000
2500
82 ' ' ‘83 ' ' ‘84 ’ ‘85 ' ' ‘86’ ’ ’ 87 ' 18
D3 = Y
0 ( 1,2, 4 季度) ? 0 (1, 3, 4 季度)
82 83 84 85 86 87 885500
82 83 84 85 86 87 88
5000 _
4500
4000
3500
3000 .
2500
全国按季节市场用煤销售量数据(file: Dummy1 )
季度
Yt
t
D1
D2
D3
季度
Yt
t
D1
D2
D3
1982.1
2599.8
1
0
0
0
1985.3
3159.1
15
0
1
0
1982.2
2647.2
2
0
0
1
1985.4
4483.2
16
1
0
0
1982.3
2912.7
3
0
1
0
1986.1
2881.8
17
0
0
0
1982.4
4087.0
4
1
0
0
1986.2
3308.7
18
0
0
1
1983.1
2806.5
5
0
0
0
1986.3
3437.5
19
0
1
0
1983.2
2672.1
6
0
0
1
1986.4
4946.8
20
1
0
0
1983.3
2943.6
7
0
1
0
1987.1
3209.0
21
0
0
0
1983.4
4193.4
8
1
0
0
1987.2
3608.1
22
0
0
1
1984.1
3001.9
9
0
0
0
1987.3
3815.6
23
0
1
0
1984.2
2969.5
10
0
0
1
1987.4
5332.3
24
1
0
0
1984.3
3287.5
11
0
1
0
1988.1
3929.8
25
0
文档评论(0)