chap07Stata与模型的设定分析.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chap07Stata与模型的设定分析

实验7-4极端数据的诊断与处理 一、实验基本原理 二、实验数据和实验内容 根据统计资料得到了美国汽车产业的横截面数据(1978年) ,变量主要包括:price=汽车的价格,mpg=每加仑油所行驶的英里数,weight=汽车的重量,foreign表示是否是进口车,如果foreign=0代表是国产车,如果foreign=1代表是进口车。完整的数据在本书附带光盘的data文件夹的“usaauto.dta”工作文件中。 利用usaauto数据,以price为因变量, mpg、weight和foreign为自变量建立回归模型,找出样本数据中存在的极端数据。 三、实验操作指导 进行极端数据的检验通常用到的是一组命令,这组命令显示如下: regress y x1 x2 …… predict lev, leverage gsort –lev sum lev list in 1/i 在这组命令语句中,第一个命令语句的作用是以y为因变量,x1、x2 ……为自变量建立回归分析;第二个命令语句的作用是计算出所有观测数据的lev值;第三个命令语句的作用是将lev值降序排列;第四个命令语句的作用是计算出lev值的极值与平均值,从而便于比较;第五个命令语句的作用是从大到小列出lev值第1到第i个观测值,以便处理。 例如,在美国汽车数据分析中,建立如下回归模型之后, 分析一下是否存在极端值所使用到的命令为: regress price mpg weight foreign predict lev, leverage gsort –lev sum lev list in 1/3 这组命令的详细含义已做介绍,这里不再赘述,其功能简言之就是建立回归模型之后,计算lev值,并将由大到小前3位的数据显示出来,执行结果如图7.15所示。在结果中可以看到lev值的均值为0.0541,而最大的lev值为0.3001,所以该观测值有可能为极端数据,可以采取进一步方法进行处理,从而保证模型的精确性。处理的方法一般有两种,一种方法为直接去掉极端值,另一种方法为选择其他更为适合恰当的模型进行回归分析。 实验7-5虚拟变量的处理 一、实验基本原理 对于定性数据或分类数据而言,通常并不能将其直接纳入模型中进行回归分析,因为这样的分析并不符合经济学理论,所以这时需要引入虚拟变量进行处理。一般情况下,如果分类变量总共有M类,为了避免多重共线性的出现,通常只引入M-1个虚拟变量。下面将会通过一个简单的例子,来介绍一下引入虚拟变量后,模型的实际变化。 二、实验数据和实验内容 根据统计资料得到了中国1978—2006年的消费数据,变量主要包括:year=年份,c=人均消费(单位:元),y=人均国民收入(单位:元),c_ratio=消费收入比。完整的数据在本书附带光盘的data文件夹的“consumption_china.dta”工作文件中。 利用此数据,估计中国的消费函数,并引入虚拟变量,使得在1992年前后的模型截距和斜率都不相同。 三、实验操作指导 为了便于比较,首先生成整个时期中不含虚拟变量的消费函数方程,所使用到的命令为: regress c y 得到如图7.16所示的回归结果,这个回归所形成的模型为c=188.588+0.3977y 如果认为在1992年,南巡讲话导致了经济结构的变动,这时需要引入虚拟变量将模型分成两段进行回归,步骤如下: 第一步,生成虚拟变量,所使用的命令为: generate dummy=0 replace dummy=1 if year=1992 在这组命令中,第一个命令的作用是生成虚拟变量dummy,使其值全部为0;第二个的命令的作用就是将1992年以后的dummy值替换为1,这时就完成了虚拟变量的设置。 第二步,生成虚拟变量dummy和解释变量y的互动项,所使用的命令为: generate dummy_y=dummy*y 这个命令的作用就是生成互动项dummy_y,使其值为变量dummy和变量y的乘积。 第三步,将虚拟变量纳入回归方程进行估计,所使用的命令为: regress c y dummy dummy_y 执行结果如图7.17所示,这时得到的模型为: 这个模型是为了讲解虚拟变量的实际使用方法,暂不考虑某些系数不能通过检验的情况。通过引入虚拟变量发现,模型的截距和斜率都发生了变化。在用户实际研究过程中,可以根据需要引入虚拟变量,进行变斜率、变截距以及二者相结合的模型变化。 实验7-6经济结构变动的Chow检验 一、实验基本原理 在时间序列模型之中,需要十分注重模型系数的稳定性,如果没有考虑到结构变动,将会造成较为严重的模型设定误差。Chow检验提供了一个较为严谨的检验经济结构变动的方法。 例如,在时期t1和t2中,认为存在t3时刻为一个经

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档