含虚拟自变量的回归剖析.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
含虚拟自变量的回归剖析

* 1 统计学上的定义和计算公式 含虚拟自变量的回归分析 定义:前面几节所讨论的回归模型中,因变量和自变量都是可以直接用数字计量的,即可以获得其实际观测值(如收入、支出、产量、国内生产总值等),这类变量称作数量变量、定量变量或数量因素。然而,在实际问题的研究中,经常会碰到一些非数量型的变量,如性别、民族、职业、文化程度、地区、正常年份与干旱年份、改革前与改革后等定性变量。 在建立一个实际问题的回归方程时,经常需要考虑这些定性变量。例如,建立粮食产量预测方程就应考虑到正常年份与受灾年份的不同影响;建立空调的销售模型时,除了要考虑居民收入和商品价格这两个量的因素之外,还必须将“季节”这个质的因素,作为一个重要解释变量。 由于受到质的因素影响,回归模型的参数不再是固定不变的。例如,在空调销售模型中,收入、价格与空调销售额的关系是随着季节变化而改变的,也就是说,在不同的季节回归模型的参数也会有所不同。再如,我国居民的消费行为在改革开放前后大不相同,因此消费函数的参数也会发生变化。显然,如果忽略质的因素,仍把模型中的参数看作是固定不变的,得到的参数估计量就不能正确描述经济变量之间的关系。 在回归分析中,对一些自变量是定性变量的先作数量化处理,处理的方法是引进只取“0”和“1”两个值的0?1型虚拟自变量。当某一属性出现时,虚拟变量取值为“1”,否则取值为“0”。例如,令“1”表示改革开放以后的时期,“0”则表示改革开放以前的时期。再如,用“l”表示某人是男性,“0”则表示某人是女性。虚拟变量也称为哑变量。需要指出的是,虽然虚拟变量取某一数值,但这一数值没有任何数量大小的意义,它仅仅用来说明观察单位的性质和属性。 如果在回归模型中需要引入多个0?1型虚拟变量D时,虚拟变量的个数应按下列原则来确定:对于包含一个具有k种特征或状态的质因素的回归模型,如果回归模型不带常数项,则中需引入k个0?1型虚拟变量D;如果有常数项,则只需引入k?1个0?1型虚拟变量D。当k=2时,只需要引入一个0?1型虚拟变量D。 计算公式如下。 下面以自变量所含定性变量是一个还是多个来分别说明如何构造含虚拟自变量的回归模型。 (1)自变量中只含一个定性变量,且这个定性变量只有两种特征的简单情况时。 (2)自变量中含多个定性变量时。 ? 研究问题 研究采取某项保险革新措施的速度y与保险公司的规模x1及其类型d之间的关系,数据如表7-6所示。 2 SPSS中实现过程 表7-6 保险公司革新情况 1 246 14 20 1 124 30 19 1 305 13 18 1 166 20 17 1 224 21 16 1 85 31 15 1 68 38 14 1 295 11 13 1 272 15 12 1 164 28 11 0 238 16 10 0 290 4 9 0 120 19 8 0 210 12 7 0 277 0 6 0 104 22 5 0 31 30 4 0 175 21 3 0 92 26 2 0 151 17 1 d x1 y i ? 实现步骤 图7-23 “Linear Regression”对话框(三) (1)第一部分输出结果文件中的第一个表格如下表所示。 3 结果和讨论 *

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档