统计学9章方法.docVIP

下载本文档

10
0
约1.28万字
约 28页
2016-12-31 发布于重庆
举报
版权申诉

统计学9章方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第9章统计方法选讲本章介绍3种常用统计方法，只给出方法的具体应用，分析计算结果，不讨论公式的推导，建模是利用软件完成。 §9.1 逐步回归模型前文已介绍 (9.1) 其中()是因变量与个自变量在时点的观测数据（称截面数据），是时点的误差项，它是具有某种分布的随机变量，上式的矩阵形式为 (9.2) 其中，，模型（9.2)通常有如下假定： (1)的个列向量线性无关，或； (2)，。假定(2)隐含着不同时点的误差项是不相关的，且是同方差的。更强的假定是服从正态分布，即。关于在上述假定下普通最小二乘估计(OLS)具有的优良性质以及在不满足上述假定下，或因自变量间存在多重共线性，或因误差项的异方差和或因误差项的序列相关而造成的后果与克服的方法，在众多的著作及教材中均有详细讨论（见[3]）。一、最优子集回归由于人们所研究的经济系统大而复杂，是在诸多经济因素相互制约，彼此影响下运行的，这就带来如下的问题: (1) 经济指标间存在固有的相关性，即它们有着共同的变化趋势。 (2) 许多经济指标既受某些指标的现期影响，也受它们的前期变动影响，因此，在刻划经济系统运行的模型中，常引入滞后变量（也称延迟变量，在时刻分别称为的一阶滞后和二阶滞后），这就增强了自变量间的多重共线性（多重相关系数显著）。 (3) 由于经济指标(包括它们的滞后变量)多，常显得样本容量不足或，而凭直觉又无法在众多的指标中进行科学筛选。 (4) 因变量是否只与个自变量有关，被选中的自变量是否都能显著解释、说明因变量？70年代末Smis，Hendry等人开始研究并提倡从“一般到特殊”的建模方法，即对所指定的模型开始考虑时应尽量详细包含尽量多的自变量，然后逐步根据观测数据的约束条件将其简化。因此在经济领域中定量刻划指标间的关联，从众多经济指标中选择经济意义与统计意义都显著的指标，是建立经济模型时所必须考虑的。随着电子计算机、计算方法和计算语言的发展，60年代开始研究最优子集回归，即按一定准则从众多自变量中筛选，以建立解释能力强、回归效果好的模型，典型的方法有向前回归和向后回归。向后回归是先将所能考虑的个自变量全部引入模型，然后逐个检验自变量的能力，依次重复进行剔除最差的自变量，直至不能剔除任何变量为止。这种方法的弊病是计算量稍大，并要求样本长度大于自变量个数。向前回归是从模型仅含常数项开始，把指标逐个引入模型，在模型已含若干自变量情况下，从没被引入的变量中比较再添加哪个变量回归效果最好，并对此变量进行统计检验，若效果显著，引入此变量并重复以上过程，若不显著，则停止向前搜索。向前法的优点是计算量小，且不必顾忌的情况，其弊病是变量只进不出，可能有这种情况发生，即随着引入的变量增多，先引入的变量的作用被后引入的变量的线性组合所替代而变得不显著。70年代开发的以向前法为基础，吸收了向后法的长处的逐步回归方法，则基本上解决了回归模型中自变量的统计意义上的筛选问题。逐步回归模型按指标的多寡，筛选方式可分为三种: (1) 单因变量对个自变量； (2) 因变量对个自变量； (3) 因变量对个自变量的双重筛选。本节只介绍单因变量对个自变量的逐步回归。二、逐步回归的原理及步骤在逐步回归中，引入或剔除某自变量，可归结为下面的模型(9.3)和(9.4)的关系。 (9.3) 增加变量，模型变为 (9.4) 也可以理解为由模型(9.4) 剔除变量变为模型(9.3)。这两个模型的残差平方和分别记为和，根据最小二乘估计的原理可以知道，由模型(9.4)变为模型(9.3)，残差平方和将增加，同样由模型(9.3)变为模型(9.4)，残差平方和将减少，自然，残差平方和的改变量都为。假定与因变量可能有关的或待考虑的自变量共有个，开始时模型引入变量个数为零，无法考虑剔除运算。因此 1．先行运算。先按向前回归方法，逐步引入3个变量，要注意的是，在以下的讨论中，常数项也算自变量。 2．剔除运算。在模型含有3个或更多自变量后，每次的运算总是先考虑剔除运算，即考虑是否因新入选变量的“加盟”，原入选变量的作用被替代。这步计算是考虑在已入选变量中，哪个变量被剔除后使残差平方和增加最少，不妨设该变量为（变量序号为,某变量被剔除后使残差平方和增加越多，该变量越显著）。若变量不显著，则剔除该变量，而后，返回到第2步，再考虑是否还有可被剔除的变量；若变量显著，表明没有变量可被剔除后，才转入第3步引入变量的运算。 3．引入运算。在模型已含有变量基础上，在没被引入的变量中，增加哪个变量，不妨设该变量为，使残差平方和减少最多，并且变量还是显著的，则引入该变量（进行引入运算），