- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chap07Stata与模型的设定分析
实验7-4极端数据的诊断与处理 一、实验基本原理 二、实验数据和实验内容 根据统计资料得到了美国汽车产业的横截面数据(1978年) ,变量主要包括:price=汽车的价格,mpg=每加仑油所行驶的英里数,weight=汽车的重量,foreign表示是否是进口车,如果foreign=0代表是国产车,如果foreign=1代表是进口车。完整的数据在本书附带光盘的data文件夹的“usaauto.dta”工作文件中。 利用usaauto数据,以price为因变量, mpg、weight和foreign为自变量建立回归模型,找出样本数据中存在的极端数据。 三、实验操作指导 进行极端数据的检验通常用到的是一组命令,这组命令显示如下: regress y x1 x2 …… predict lev, leverage gsort –lev sum lev list in 1/i 在这组命令语句中,第一个命令语句的作用是以y为因变量,x1、x2 ……为自变量建立回归分析;第二个命令语句的作用是计算出所有观测数据的lev值;第三个命令语句的作用是将lev值降序排列;第四个命令语句的作用是计算出lev值的极值与平均值,从而便于比较;第五个命令语句的作用是从大到小列出lev值第1到第i个观测值,以便处理。 例如,在美国汽车数据分析中,建立如下回归模型之后, 分析一下是否存在极端值所使用到的命令为: regress price mpg weight foreign predict lev, leverage gsort –lev sum lev list in 1/3 这组命令的详细含义已做介绍,这里不再赘述,其功能简言之就是建立回归模型之后,计算lev值,并将由大到小前3位的数据显示出来,执行结果如图7.15所示。在结果中可以看到lev值的均值为0.0541,而最大的lev值为0.3001,所以该观测值有可能为极端数据,可以采取进一步方法进行处理,从而保证模型的精确性。处理的方法一般有两种,一种方法为直接去掉极端值,另一种方法为选择其他更为适合恰当的模型进行回归分析。 实验7-5虚拟变量的处理 一、实验基本原理 对于定性数据或分类数据而言,通常并不能将其直接纳入模型中进行回归分析,因为这样的分析并不符合经济学理论,所以这时需要引入虚拟变量进行处理。一般情况下,如果分类变量总共有M类,为了避免多重共线性的出现,通常只引入M-1个虚拟变量。下面将会通过一个简单的例子,来介绍一下引入虚拟变量后,模型的实际变化。 二、实验数据和实验内容 根据统计资料得到了中国1978—2006年的消费数据,变量主要包括:year=年份,c=人均消费(单位:元),y=人均国民收入(单位:元),c_ratio=消费收入比。完整的数据在本书附带光盘的data文件夹的“consumption_china.dta”工作文件中。 利用此数据,估计中国的消费函数,并引入虚拟变量,使得在1992年前后的模型截距和斜率都不相同。 三、实验操作指导 为了便于比较,首先生成整个时期中不含虚拟变量的消费函数方程,所使用到的命令为: regress c y 得到如图7.16所示的回归结果,这个回归所形成的模型为c=188.588+0.3977y 如果认为在1992年,南巡讲话导致了经济结构的变动,这时需要引入虚拟变量将模型分成两段进行回归,步骤如下: 第一步,生成虚拟变量,所使用的命令为: generate dummy=0 replace dummy=1 if year=1992 在这组命令中,第一个命令的作用是生成虚拟变量dummy,使其值全部为0;第二个的命令的作用就是将1992年以后的dummy值替换为1,这时就完成了虚拟变量的设置。 第二步,生成虚拟变量dummy和解释变量y的互动项,所使用的命令为: generate dummy_y=dummy*y 这个命令的作用就是生成互动项dummy_y,使其值为变量dummy和变量y的乘积。 第三步,将虚拟变量纳入回归方程进行估计,所使用的命令为: regress c y dummy dummy_y 执行结果如图7.17所示,这时得到的模型为: 这个模型是为了讲解虚拟变量的实际使用方法,暂不考虑某些系数不能通过检验的情况。通过引入虚拟变量发现,模型的截距和斜率都发生了变化。在用户实际研究过程中,可以根据需要引入虚拟变量,进行变斜率、变截距以及二者相结合的模型变化。 实验7-6经济结构变动的Chow检验 一、实验基本原理 在时间序列模型之中,需要十分注重模型系数的稳定性,如果没有考虑到结构变动,将会造成较为严重的模型设定误差。Chow检验提供了一个较为严谨的检验经济结构变动的方法。 例如,在时期t1和t2中,认为存在t3时刻为一个经
您可能关注的文档
- ch2初等模型分析.ppt
- CH2线性表分析.ppt
- ch4关系数据库设计原理分析.ppt
- ch5商务策划文案的结构与章法分析.pptx
- CH5关系数据理论及求精分析.ppt
- CH5-5ed运输层分析.ppt
- ch4需求分析分析.ppt
- CH5机器设备评估1资产评估分析.ppt
- ch6-例外(Exception)处理分析.ppt
- ch5约束满足问题人工智能课程北大计算机研究所分析.ppt
- 2020年注册会计师全国统一考试大纲—专业阶段考试.pdf
- 2020年注册消防工程师考试《案例分析》预测试题四.pdf
- 2021-2022学年新教材高中英语单元形成性评价三Unit2TravellingAround含解析新人教版必修第一册.pdf
- 2020天津和平中考英语真题(含答案).pdf
- 2020年美发师高级工理论知识模拟试题库及答案(共300题).pdf
- 2020云南昆明中考英语真题及答案.pdf
- 2020年考研英语完型填空词汇辨析(四).pdf
- 2020年监理工程师考试《建设工程目标控制(土木建筑工程)》真题及答案.pdf
- 2020年银行笔试基础知识总结及精讲.pdf
- 2020年陕西省下半年中西医助理医师针灸学鱼际考试试卷.pdf
文档评论(0)