第4章自变量中含有定性变量的回归分析讲解.pptVIP

第4章自变量中含有定性变量的回归分析讲解.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章自变量中含有定性变量的回归分析讲解

线性回归模型的基本假定 误差为独立正态分布的随机变量,其均值为零且方差相等 (1)误差项的数学期望为0,表明估计的回归方程中不存在系统性误差(Systematic Error); (2)各误差项的方差相等; (3)各误差项之间的协方差为0; 以上三项基本假定一般又称为Gauss-Markov高斯-马尔柯夫条件。 (4)自变量与误差项之间的协方差为0,不存在多重共线性; (5)自变量的样本容量必须大于自变量的项数加1。 多元回归中的几种重要模型 第一部分:多重共线情况的处理 第3章 岭回归分析( Ridge Regression ) 第二部分:自变量中含定性变量的处理 第4章 自变量中含有定性变量的回归分析 第三部分:因变量中含有定性变量情况的处理 第5章 二项Logistic回归 第6章 多项Logistic回归 第7章 有序回归(等级回归分析) 第8章 Probit回归(概率单位回归) 第9章 最佳尺度回归 本章总结 第4章 自变量中含有定性变量的回归分析 4.1 只有一个虚拟变量的回归 4.2 含有多个虚拟变量的回归 4.3 分段回归 第4章 自变量中含有定性变量的回归分析 在社会经济研究中,由许多定性变量,比如地区、民族、性别、文化程度、职业和居住地等。 可以应用它们的信息进行线性回归。 但是,必须现将定性变量转换为虚拟变量( (dummy variable)也称哑变量或定性变量),然后再将它们引入方程,所得的回归结果才有明确的解释意义。 只取0和1两个值的变量称为虚拟变量。 对于具有k类的定性变量来说,设虚拟变量时,我们只设k-1个虚拟变量。 回归模型中使用虚拟自变量时,称为虚拟自变量的回归 当虚拟自变量只有两个水平时,可在回归中引入一个虚拟变量 比如,性别(男,女) 一般而言,如果定性自变量有k个水平/类别,需要在回归中模型中引进k-1个虚拟变量,如果引入k个虚拟变量将会产生完全多重共线性问题(称为虚拟变量陷阱) 虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。 (1)加法方式 引进虚拟变量 建立回归方程:E(Y)=?0+ ?1x1+ ?2x2+?3x3(加法公式) ?0—家电制造业投诉次数的平均值 (?0+ ?1)—零售业投诉次数的平均值 (?0+ ?2)—旅游业投诉次数的平均值 (?0+ ?3)—航空公司投诉次数的平均值 例:考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上 这时需要引入两个虚拟变量: D1= 1 高中 0 其它 D2= 1 大学及其以上 0 其它 模型可设定如下: 高中以下: E(Yi|Xi,D1i=0,D2i=0)=β0+β1Xi 高中: 大学及其以上: E(Yi|Xi,D1i=1,D2i=0)=(β0+β2 )+β1Xi E(Yi|Xi,D1i=0,D2i=1)=(β0+β3 )+β1Xi 在 =0的初始假定下,容易得到高中以下、高中、大学及其以上 教育水平个人平均保健支出的函数: 假定 ,且 ,则其几何意义如图1所示。 图1 不同教育程度人员保健支出示意图 有相同的斜率,但有不同的截距 (2)乘法方式——斜率的变化 例:根据消费理论,消费水平C主要取决于收入水平X。但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。 设 Dt= 1 正常年份 0 反常年份 则消费模型可建立如下: 这里,虚拟变量 Dt 以与 Xt 相乘的方式引入了模型中,从而可用来考察消费倾向的变化。 在E(μt)=0的假定下,上述模型所表示的函数可化为: 正常年份: 反常年份: 图2 不同年份消费倾向示意图 假定 0, 则其几何图形如图2所示。 如果在模型中同时使用加法和乘法两种方式引入虚拟变量,则回归线的截距和斜率都会改变。 例如: 对于改革开放前后储蓄-收入模型,可设定为 其中,Y为储蓄,X为收入,Dt为虚拟变量 Dt= 1 改革开放以后 0 改革开放以前 显然在上式中,同时使用加法和乘法两种方式引入了虚拟变量。 在E(μt)=0的假定下,上述模型所表示的函数可化为:

文档评论(0)

4477704 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档